پایتون در علوم داده
مترجم : آزاده رضازاده همدانی
برنامه نویسی در حوزه علوم داده, به یک زبان منعطف اما همه جانبه نیاز دارد تا در حین کدنویسی آسان, قدرت پردازش محاسبات پیچیده ریاضی را داشته باشد. پایتون مناسبترین زبان برای برآورده کردن نیازهای فوق الذکر میباشد زیرا تا کنون تواناییهای خود را علاوه بر برنامه نویسی همگانی در برنامه نویسی علمی و تخصصی نیز به اثبات رسانیده است. علاوه بر آن به طور مداوم کتابخانههای خود را به منظور برطرف کردن نیازهای برنامه نویسی ارتقا میدهد. در ادامه پیرامون تعدادی از ویژگیهای پایتون که آن را به زبان محبوب در حوزه علوم داده تبدیل کرده است صحبت میشود:
· یک زبان برنامه نویسی ساده و در عین حال با امکان یادگیری راحت که درمقایسه با زبانهای مشابه مانند R به تولید خطوط کد کمتر برای تولید نتیجه نیازمند است. سادگی این زبان برنامه نویسی باعث میشود تا قادر باشد مسایل پیچیده را با کمترین میزان کد و همچنین کمترین اشفتگی و بهم ریختگی در روند برنامه اجرا نماید.
· یک کد یکسان در محیط های متنوع برنامه نویسی بدون هیچگونه تغییری قابل اجرا است.
· در مقایسه با سایر زبانهای برنامه نویسی تحلیل داده ازجمله R و MAtlab از سرعت بالاتری برخوردار است.
· توانایی بالای آن در مدیریت حافظه مخصوصا garbage collection این امکان را ایجاد نموده است که به ابزاری قدرتمند در زمینه تبدیل, قطعه بندی, بصری سازی,.. دادههای حجیم مبدل شود.
· زبان پایتون شامل مجموعه عظیمی از کتابخانه های موردنیاز تحلیل داده را دارا میباشد.به طور مثال آررایه موجود در کتابخانه NUMPY در محاسبات علمی به حافظه کمتری نسبت به داده list که برای نگهداری دادهای عددی در پایتون تعریف شده است, نیازمند است.
· در پایتون package هایی وجود دارد که امکان اجرای کدهایی به زبان C و یا Java را میدهد. که این امر باعث کاراتر شدن کد و استفاده از سایر کدهای موجود در سایر زبانها می-باشد.
در بخشهای بعدی چگونگی استفاده از ویژگیهای پایتون را در حل مسایل متفاوت در حوزه علوم داده مشاهده خواهید نمود.