وبلاگ

مسیر علم داده (انتخاب مسیر) – قسمت چهارم علم داده

مسیر علم داده
علم داده هوش مصنوعی

مسیر علم داده (انتخاب مسیر) – قسمت چهارم علم داده

در قسمت قبل از سری مقالات علم داده مشاغل علم داده را به صورت کامل و جامع مورد بررسی قرار دادیم. علم داده دانشی میان‌ رشته‌ای پیرامون استخراج دانش و آگاهی از مجموعه‌ای داده و اطلاعات است. علم داده از ترکیب مباحث مختلفی به وجود آمده و بر مبانی و روش‌های موجود در حوزه‌های مختلف علمی بنا شده‌است. تعدادی از این حوزه‌ها عبارتند از: ریاضیات، آمار، علوم کامپیوتر، مهندسی داده، بازشناخت الگو و… در سلسله مقالات علم داده ما به بررسی کامل این حوزه خواهیم پرداخت . در این قسمت از سری مقالات ما به بررسی انتخاب مسیر علم داده  خواهیم پرداخت . پس با ما تا انتهای این قسمت همراه باشید .

دراین قسمت به برخی از گزینه ها برای کسب مهارت های علم داده، مزایا و معایب و چند پیشنهاد برای انتخاب از میان آنها می پردازیم. در این مرحله، خوب است که درباره حوزه علم داده ای که می خواهید در آن تخصص داشته باشید فکر کنید. اگر از قبل در علم داده فعالیت میکنید، بهتر است فکر کنید که در کدام بخش
از مثلث قرار دارید. آیا از آن راضی هستید؟ آیا می خواهید به نوع دیگری از شغل علم داده تغییر دهید؟ انتقال اغلب در دسترس است.

ویکی بویکیس: آیا هر کسی می تواند دانشمند داده شود؟

با همه خوش بینی ها (و حقوق های بالقوه بزرگ ذکر شده در مقالات خبری) در مورد علم داده، به راحتی میتوان فهمید که چرا فرصت های شغلی جذابی را ارائه می دهد، به ویژه که دامنه عناوین شغلی علم داده همچنان در حال گسترش است. اما به عنوان یک تازه وارد در این زمینه، مهم است که دیدگاهی واقع بینانه و دقیق از مسیر حرکت بازار علم داده در چند سال آینده داشته باشید و بر اساس آن تنظیم کنید.

امروزه چند روند وجود دارد که بر حوزه علم داده تأثیر می گذارد.

مسیر علم داده

حوزه نوظهور

علم داده به عنوان یک حوزه ده سال است که وجود داشته است، و به این ترتیب، در مراحل اولیه چرخه هایپ یا hype تبلیغات رسانه های جمعی، پذیرش اولیه، و تثبیت حرکت کرده است و در رسانه ها درباره آن صحبت شده است، شرکت های دره سیلیکون و فراتر از آن به تصویب رسیده اند، و ما اکنون در نقطه پذیرش با رشد بالا در شرکت های بزرگتر و استانداردسازی مجموعه های ابزار گردش کار علم داده مانند Spark و AutoML هستیم.

دانشمندان خودآموز

در نتیجه، تعداد بیش از حد دانشمندان داده جدید وجود دارد که از بوت کمپ ها، برنامه های تازه تاسیس علم داده در دانشگاه ها یا دوره های آنلاین آمده اند. تعداد نامزدها برای هر موقعیت معین علم داده، به ویژه در سطح ورودی، از 20 یا بیشتر در هرجایگاه به 100 یا بیشتر افزایش یافته است. دیدن 500 رزومه در هر موقعیت باز غیر معمول نیست.

استاندارد سازی ابزارها

استاندارد سازی مجموعه ابزارها و عرضه آماده نیروی کار، و همچنین تقاضا برای افرادی که تجربه بیشتری در این زمینه دارند. به معنای تغییر در نحوه توزیع عناوین علم داده و ایجاد سلسله مراتبی از مشاغل علوم داده  در مسیر علم داده است. اما در برخی بیشتر به معنای اجرای تجزیه و تحلیل { دانشمند داده } برخی از شرکتها SQL است. معادل آنچه عنوان تحلیلگر داده در گذشته بود. این برای کسانی که به عنوان تازه وارد به دنبال ورود به علم داده هستند، چندین چیز دارد.

اول و مهمتر از همه، آنها ممکن است بازار کار را بسیار رقابتی و شلوغ بدانند. به ویژه برای کسانی که به طور کلی در این صنعت تازه کار هستند. (مانند فارغ التحصیلان دانشگاه)، یا کسانی که در حال گذار از صنایع دیگر هستند و با هزاران نامزد رقابت می کنند درست مثل آنها. همچنین آنها ممکن است برای مشاغلی درخواست دهند که واقعاً منعکس کننده علم داده نیستند. همانطور که در پست های وبلاگ و مطبوعات محبوب نشان داده شده است – فقط نوشتن و پیاده سازی الگوریتم ها.

با توجه به این روندها، درک این نکته مهم است که ممکن است در ابتدا سخت باشد که خودتان را از سایر رزومه های موجود متمایز کنید. اگرچه استراتژی هایی که در این سلسله مقالات میخوانید ممکن است کار بسیار زیادی به نظر برسند. اما به شما کمک میکنند که در این محیط جدید و رقابتی علم داده، برجسته شوید.

مسیر علم داده

مصاحبه با رابرت چانگ، دانشمند داده

رابرت چانگ یک دانشمند داده در Airbnb است که در آنجا روی محصول Airbnb Plus کار می کند. او قبلاً در توییتر کار می کرد، جایی که در تیم رشد کار می کرد، تجزیه و تحلیل محصول، ایجاد خطوط لوله داده، اجرای آزمایش ها و ایجاد مدل ها را انجام می داد. می توانید پست های وبلاگ او در مورد مهندسی داده، توصیه های او برای دانشمندان داده جدید و مشتاق، و کارهای او در Airbnb و Twitter را در این لینک  بیابید.

اولین سفر علم داده شما چه بود؟

اولین کار من به عنوان یک دانشمند داده در واشنگتن پست بود. در سال 2012 ، من آماده بودم که دانشگاه را ترک کنم و وارد صنعت شوم، اما نمی دانستم می خواهم چه کار کنم. من امیدوار بودم که یک دانشمند visualization داده باشم، زیرا تحت تأثیر کار در نیویورک تایمز قرار گرفته بودم. وقتی به نمایشگاه شغلی مدرسه ام رفتم و دیدم واشنگتن پست، همان طور که من ساده لوح بودم، استخدام می کند، فکر کردم که آنها باید کارهایی مشابه نیویورک تایمز انجام دهند. من درخواست دادم و این کار را دریافت کردم، بدون اینکه کار لازم را انجام دهم.

اکثر کار من، ساخت خطوط لوله (ETL) extract transform load ، اجرای مجدد اسکریپت های SQL و تلاش برای اطمینان از اجرای گزارش ها بود تا بتوانیم معیارهای سطح بالا را به مدیران گزارش دهیم. این در آن زمان بسیار دردناک بود. متوجه شدم کاری که میخواهم انجام دهم با آنچه شرکت واقعاً نیاز داشت هماهنگ نیست و در نهایت کار را ترک کردم.
اما در سالهای بعدی که در توییتر و Airbnb کار کردم، متوجه شدم که هنجار را میبینم نه استثنا. وقتی قابلیت های داده را ایجاد می کنید، باید آن را لایه به لایه بسازید. مونیکا روگاتی یک پست وبلاگ معروف در مورد سلسله مراتب نیازهای علم داده نوشته است که بسیار دقیق است (لینک سایت) . اما در آن زمان، من آنقدر تازه کار بودم که نمیتوانستم بفهمم کار علم داده های واقعی و زنده چقدر انجام شده است.

افراد باید در مسیر علم داده به دنبال چه چیزی باشند؟

اگر به دنبال یک موقعیت شغلی علم داده هستید، باید روی وضعیت زیرساخت داده شرکت تمرکز کنید. در صورتی که به شرکتی بپیوندید که در آن فقط یک دسته داده خام وجود دارد که در انبار داده یا warehouse ذخیره نشده است، احتمالاً ماه ها یا گاهی حتی سال ها طول می کشد تا به نقطه ای برسید که بتوانید تجزیه و تحلیل، آزمایش یا یادگیری ماشین جالبی انجام دهید. اگر این چیزی نیست که شما انتظار انجام آن را دارید، یک ناهماهنگی اساسی بین مرحله شرکت و نحوه کمک به سازمان خواهید داشت.

آیا تیم زیرساخت داده دارید؟ هنگامی که در حال ساختن یک محصول جدید هستید، آیا فرآیندی برای ابزارسازی گزارشها، ساخت جداول داده ها و قرار دادن آنها در انبار داده خود دارید؟ اگر آن چیزها وجود ندارند، شما بخشی از تیمی خواهید بود که مسئول ساختن آن است، و باید انتظار داشته باشید که زمان زیادی را برای آن صرف کنید.
دومین چیزی که باید به دنبال آن باشید مردم هستند. سه دسته از افراد وجود دارند که باید به آنها توجه کنید. با فرض اینکه نمی خواهید اولین دانشمند داده باشید، می خواهید به یک سازمان علم داده بپیوندید که در آن یک رهبر با تجربه وجود دارد. یک رهبر باتجربه می داند که چگونه یک زیرساخت و گردش کار خوب برای دانشمندان داده ایجاد و حفظ کند تا مولد باشند. دوم، به دنبال مدیری باشید که از یادگیری مستمر حمایت می کند. در نهایت، کار با یک رهبر فناوری یا دانشمند ارشد داده که بسیار عملی است، بسیار مهم است. برای کارهای روزمره شما، این شخصی است که بیشترین کمک را به شما می کند.

برای اینکه یک دانشمند داده باشید به چه مهارت هایی نیاز دارید؟

من فکر می کنم بستگی به نوع شغلی دارد که به دنبال آن هستید و کارفرما چه محدودیتی را تعیین می کند. شرکت های سطح بالا به طور کلی دارای نوار بالایی هستند،. گاهی اوقات به طور غیر منطقی بالا، زیرا افراد زیادی برای پیوستن به شرکت تلاش می کنند. آنها عموماً به دنبال باهوش هستند – کسی که مهارت های جدال داده با R یا Python و همچنین تجربه ساخت خطوط لوله ETL ، مهندسی داده، طراحی experiment ، و ساخت مدلها و تولید آنها را داشته باشد. که فشار زیادی به نامزدها وارد می کند! در حالی که همه اینها مهارت هایی هستند که در نهایت می توانید یاد بگیرید و ممکن است برای هر مشکلی که حل می کنید مفید باشد، فکر نمی کنم برای ورود به علم داده ضروری باشد.

اگر R یا Python و کمی SQL می دانید، در حال حاضر در موقعیت بسیار خوبی برای ورود به علم داده هستید. اگر بتوانید با یادگیری چیزهای بیشتر از قبل، شغل خود را برنامه ریزی کنیداین همیشه مفید است، اما فکر نمی کنم این یک الزام باشد. عشق به یادگیری مهم تر است. اگر میخواهید توسط شرکتهای فناوری برتر استخدام شوید، به مقداری بیشتر نیاز دارید، اما این بیشتر برای تأثیر سیگنال است تا آنچه واقعاً در کار نیاز دارید. اگر می خواهید وارد یک شرکت رقابتی با نام تجاری شوید، تفاوت بین مهارت های اصلی که برای شروع حرفه خود در علم داده نیاز دارید و مهارت های دیگری که داشتن آنها خوب است، مفید است.

جمع بندی مسیر علم داده

 

 

در مسیر علم داده ، مجموعه مهارت ها در افراد و موقعیت ها متفاوت است. اگرچه برخی از دانش ها اساسی هستند، اما دانشمندان داده نیازی به متخصص بودن در هر زمینه مرتبط ندارند.
مشاغل علم داده بر حوزه های مختلف تمرکز دارند: قرار دادن داده های صحیح و تمیز در مقابل ذینفعان (تحلیل). قرار دادن مدل های یادگیری ماشین در تولید (یادگیری ماشین)؛ و استفاده از داده ها برای تصمیم گیری (علم تصمیم گیری).

دیدگاه خود را اینجا قرار دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

فیلدهای نمایش داده شده را انتخاب کنید. دیگران مخفی خواهند شد. برای تنظیم مجدد سفارش ، بکشید و رها کنید.
  • عکس
  • شناسه محصول
  • امتیاز
  • قیمت
  • در انبار
  • موجودی
  • افزودن به سبد خرید
  • توضیحات
  • محتوا
  • عرض
  • اندازه
  • تنظیمات بیشتر
  • ویژگی ها
  • ویژگی های سفارشی
  • زمینه های دلخواه
برای پنهان کردن نوار مقایسه ، بیرون را کلیک کنید
مقایسه