شرکت ها علم داده – قسمت اول
24 دی 1401 1401-10-24 0:16شرکت ها علم داده – قسمت اول
شرکت ها علم داده – قسمت اول
در سلسله مقالات گذشته به بررسی کامل مباحث مربوط به حوزه علم داده پرداختیم. از این قسمت به سراغ معرفی شرکت ها علم داده خواهیم پرداخت و انواع شرکت ها علم داده که متخصص را استخدام می کنند ، مزایا و معایب هر نوع شرکت و انواع فناوری که ممکن است در مشاغل دیده شود را بررسی می کنیم. پس با ما در این سری مقالات نیز همراه باشید
همانطور که در قسمت های قبلی بحث شد، علم داده حوزه وسیع با نقش های مختلف از قبیل دانشمند، مهندس یادگیری ماشین، تحلیلگر هوش تجاری و موارد دیگرمی باشد. اگرچه کاری که شما به عنوان دانشمند داده انجام می دهید به نقش شما بستگی دارد، اما به همان اندازه تحت تأثیر شرکتی است که در آن کار می کنید.
شرکت بزرگ در مقابل شرکت کوچک در حوزه شرکت ها علم داده، صنعت فناوری محور در مقابل صنایع سنتی ، و شرکت نوپا در مقابل شرکت های ریشه دار می توانند بر تمرکز پروژه ، تکنولوژی آن و فرهنگ تیمی را شرکت ها علم داده تحت تاثیر قرار دهند. هدف این فصل این است که به شما درک درستی از اینکه برخی از شرکتهای معمولی در هر روز چگونه کار میکنند، ارائه میکند. ما پنج شرکت تخیلی را معرفی می کنیم که دانشمندان داده را استخدام می کنند. هیچ یک از این شرکت ها واقعی نیستند. اما همه بر اساس تحقیقات و تجربیات کاری خود ما هستند. و اصول اولیه ای را نشان می دهند که می تواند به طور گسترده اعمال شود. اگرچه هیچ دو شرکتی دقیقاً شبیه هم نیستند، دانستن این پنج الگو باید به شما در ارزیابی کارفرمایان آینده کمک کند.
1 – MTC : شرکت فناوری Massive
- مشابه: گوگل، فیسبوک و مایکروسافت
- سن شرکت: 20 سال
- تعداد کارمندان: 80000 نفر
MTC یکی از شرکت ها علم داده می باشد. یک شرکت فناوری با ردپایی عظیم است که خدمات ابری، نرم افزار بهره وری مصرف کننده مانند ویرایشگر متن، سخت افزار سرور و راه حل های تجاری بیشماری را می فروشد. این شرکت ثروت زیادی جمع آوری کرده است و از آن برای تأمین مالی پروژه های تحقیق و توسعه غیرمعمول ( R&D ) مانند اسکوترهای خودران و فناوری واقعیت مجازی ( VR ) استفاده می کند. تحقیق و توسعه آنها خبرساز می شود، اما اکثر اعضای نیروی کار فنی مهندسین هستند که بهبودهای تدریجی را در محصولات موجود خود ایجاد می کنند. ویژگی های بیشتری را اضافه می کنند، رابط کاربری را بهبود می بخشند و نسخه های جدید را راه اندازی می کنند.
1-1 یکی از چندین تیم MTC
MTC نزدیک به هزار دانشمند داده در سراسر شرکت دارد. این دانشمندان داده عمدتاً در تیم هایی دسته بندی می شوند که هر کدام از محصول یا بخش متفاوتی پشتیبانی میکنند. و یا به صورت جداگانه در یک تیم علمی غیر داده قرار می گیرند تا به طور کامل از آن پشتیبانی کنند. به عنوان مثال، دانشمندان داده هدست واقعیت مجازی در یک تیم، دانشمندان داده بازاریابی در تیم دوم، و دانشمندان داده های بازاریابی هدست واقعیت مجازی در تیم سوم وجود دارند، در حالی که تیم زنجیره تامین هدست واقعیت مجازی نیز دانشمند داده خود را دارد.
اگر عضو یکی از آن تیم های علم داده بودید، زمانی که به آن ملحق میشوید، به سرعت وارد میشوید. سازمانهای بزرگ هر روز افراد جدیدی را استخدام میکنند، بنابراین شرکت باید فرآیندهای استانداردی برای دریافت لپتاپ و دسترسی به داده ها و همچنین آموزش نحوه استفاده از ابزارهای خاص داشته باشد. در تیم، شما وظیفه دارید علم داده را برای حوزه تمرکز خاص خود انجام دهید. این حوزه می تواند شامل ایجاد گزارش ها و نمودارهایی باشد که مدیران می توانند برای توجیه بودجه پروژه ها از آنها استفاده کنند. همچنین میتواند ساخت مدلهای یادگیری ماشین باشد که به
توسعه دهندگان نرم افزار واگذار می شود تا تولید شوند.
تیم شما احتمالاً بزرگ و پر از افراد با تجربه است. از آنجایی که MTC یک شرکت فناوری بزرگ و موفق است، ردپای گسترده ای برای جذب افراد خوب برای استخدام دارد. تیم شما بزرگ خواهد بود، بنابراین افراد درون آن ممکن است روی کارهای تقریباً نامرتبط کار کنند. برای مثال، یک نفر میتواند یک تحلیل اکتشافی برای یک کار در R انجام دهد و دیگری میتواند یک مدل یادگیری ماشین در پایتون برای یک تیم بسازد.
1.2 فن آوری: پیشرفته، اما در سراسر شرکت خاموش شده است
MTC یک سازمان عظیم است و با سازمان هایی با این اندازه، اجتناب از استفاده از انواع مختلف فناوری در سراسر شرکت غیرممکن است. یک بخش ممکن است اطلاعات سفارش و مشتری را در پایگاه داده Microsoft SQL Server ذخیره کند. یک بخش مختلف ممکن است سوابق را در Apache Hive نگه دارد. بدتر از آن، نه تنها فناوری ذخیره دادهها از هم گسسته است، بلکه ممکن است خود داده نیز از هم جدا باشد. یادگیری این ابزارهای تخصصی برای دسترسی بیشتر شما به MTC عالی است، اما دانشی که به دست می آورید نمی تواند به شرکت های دیگر منتقل شود. به عنوان یک دانشمند داده، احتمالاً از چندین ابزار ممکن استفاده خواهید کرد. از آنجایی که MTC بسیار بزرگ است، از زبانهای اصلی مانند R و Python که بسیاری از مردم از
آنها استفاده میکنند، پشتیبانی زیادی دارد. برخی از تیم ها ممکن است از زبان های پولی مانند SAS یا SPSS نیز استفاده کنند، اما این وضعیت کمی نادرتر است. هیچ مکان مرکزی برای یادگیری و درک آنچه در حال وقوع است وجود ندارد.
1-3 مزایا و معایب MTC
دانشمند داده بودن در MTC به معنای داشتن یک شغل چشمگیر در یک شرکت چشمگیر است. تعداد بالای دانشمندان داده در شرکت به این معنی است که شما یک شبکه پشتیبانی بزرگ دارید که در صورت مشکل می توانید به آن اعتماد کنید، همچنین فرآیندهای روان برای پیوستن به شرکت و دسترسی به منابع مورد نیاز. داشتن تعداد زیادی از دانشمندان داده در اطراف شما با معایبی نیز همراه است.
انواع فناوری پیچیده است و پیمایش آن دشوار است زیرا افراد زیادی آن را به طرق مختلف ساخته اند. تحلیلی که از شما خواسته شده است دوباره ایجاد کنید ممکن است توسط شخصی که دیگر در اطراف شما نیست به زبانی نوشته شود که شما نمی دانید. متمایز شدن و مورد توجه قرار گرفتن دشوارتر خواهد بود زیرا دانشمندان داده های بسیار دیگری در اطراف شما وجود دارند. و ممکن است پیدا کردن یک پروژه جالب برای کار کردن برای شما دشوار باشد زیرا بسیاری از پروژه های واضح قبلاً توسط افراد دیگر شروع شده اند.
از آنجایی که MTC یک شرکت معتبر است، کار در آنجا به شما امنیت شغلی بیشتری می دهد.
همیشه خطر اخراج وجود دارد، اما کار برای MTC مانند کار کردن برای یک استارتاپ نیست، جایی که بودجه ممکن است هر لحظه تمام شود.
همچنین، در شرکتهای بزرگ، مدیران به جای اخراج، بیشتر به دنبال یافتن تیم جدیدی برای کار کردن هستند. اخراج انواع پیچیدگی های قانونی را باز می کند که به پشتیبانی کامل پشتیبان برای تصمیم فسخ نیاز دارد. چیزی که هم طرفدار و هم مخالف این است که افراد در بسیاری از نقش های تخصصی در شرکت خدمت می کنند. به عنوان مثال، شما شانس کمی دارید که مجبور شوید پایگاه داده خود را ایجاد کنید. این موقعیت برای کنار گذاشتن کار خارج از تخصص شما عالی است، اما به این معنی است که نمی توانید مهارت های خود را گسترش دهید.
یکی دیگر از معایب MTC بوروکراسی است. در یک شرکت بزرگ، گرفتن تاییدیه برای چیزهایی مانند فناوری جدید، سفر به کنفرانسها و شروع پروژه ها میتواند مستلزم بالا رفتن زنجیره فرماندهی باشد. بدتر از آن،
پروژهای که سالها روی آن کار میکردید ممکن است لغو شود، زیرا دو مدیر اجرایی با هم درگیر هستند و پروژه شما آسیب جانبی دارد. MTC یک شرکت عالی برای دانشمندان داده است که به دنبال کمک به حل مشکلات بزرگ با استفاده از تکنیکهای پیشرفته هستند. هم دانشمندان تصمیم گیری که میخواهند تجزیه و تحلیل کنند و هم مهندسان یادگیری ماشین که میخواهند مدلهایی بسازند و به کار بگیرند. شرکتهای بزرگ مشکلات زیادی برای حل کردن دارند و بودجهای دارند که امکان امتحان کردن چیزهای جدید را فراهم میکند. ممکن است نتوانید خودتان تصمیمات بزرگ بگیرید، اما می دانید که در این امر نقش داشته اید.
2 – HandbagLOVE : خرده فروش
- مشابه: Payless ، Bed Bath & Beyond ، و Best Buy
- سن شرکت: 45 سال
- تتعداد کارمندان: 15000 کارمند ( 10000 در فروشگاههای خرده فروشی، 5000 در شرکتهای بزرگ)
HandbagLOVE یک زنجیره خرده فروشی
HandbagLOVE یکی از شرکت ها علم داده، یک زنجیره خرده فروشی با 250 مکان در سراسر ایالات متحده است که کیف و کفش میفروشند. این شرکت مدت زیادی است که وجود داشته است و مملو از متخصصان در مورد نحوه چیدمان فروشگاه و بهبود تجربه مشتری است. این شرکت در پذیرش فناوری جدید کند بوده است و زمان زیادی را قبل از دریافت اولین وب سایت و اولین برنامه خود صرف کرده است. اخیراً، HandbagLOVE شاهد کاهش فروش خود بوده است، زیرا آمازون و سایر خرده فروشان آنلاین سهم بازار آن را از دست داده اند. HandbagLOVE با دانستن اینکه نوشته روی دیوار است، به دنبال بهبود از طریق فناوری، سرمایه گذاری
در یک برنامه آنلاین و مهارت آمازون الکسا و تلاش برای استفاده از ارزش داده های خود بوده است. HandbagLOVE سالهاست که تحلیلگران مالی را برای محاسبه آمار کل سطح بالای سفارشها و مشتریان خود به کار گرفته است، اما اخیراً این شرکت به استخدام دانشمندان داده برای کمک به آنها در درک بهتر رفتار مشتری فکر کرده است.
پیش بینی های آماری ماهانه در مورد رشد مشتری در R ، داشبوردهای تعاملی که به مدیران اجازه میدهد فروش را بهتر درک کنند، و تقسیم بندی مشتری که مشتریان را در گروه های مفید قرار میدهد. بازاریابی. اگرچه این تیم مدلهای یادگیری ماشین را برای تقویت گزارش ها و تحلیل های جدید ساخته است، HandbagLOVE که قرار است یکی از شرکت ها علم داده باشد ، از بکارگیری مدلهای یادگیری ماشین در تولید مداوم فاصله دارد. هر توصیه محصول در وب سایت و برنامه آن به جای اینکه در شرکت ساخته شده باشد، توسط محصولات یادگیری ماشین شخص ثالث ارائه می شود. در تیم علم داده صحبت هایی در مورد تغییر این وضعیت وجود دارد، اما هیچ کس نمی داند چند سال دیگر تا آن زمان باقی مانده است.
2.1 تیم شما: گروه کوچکی که در تلاش برای رشد هستند
درشرکت ها علم داده این تیم به شدت به دانشمندان دادهای متمایل است که میتوانند گزارش دهی کنند تا اینکه در زمینه یادگیری ماشین آموزش ببینند، زیرا یادگیری ماشین بسیار جدید است. این خودآموزی از این جهت عالی است که افراد تکنیک های جدیدی را یاد می گیرند که برایشان جالب است. نکته منفی این است که برخی از روش های فنی مورد استفاده ممکن است ناکارآمد یا حتی اشتباه باشند، زیرا هیچ متخصصی برای بررسی کار وجود ندارد. HandbagLOVE مسیرهای کلی برای پیشرفت دانشمندان داده در نقش های ارشد را مشخص کرده است.
متأسفانه، این مسیرهای شغلی مختص علم داده نیستند. آنها اهداف سطح بالایی هستند که از موقعیت های دیگر مانند توسعه نرم افزار کپی و جایگذاری شده اند زیرا هیچ کس واقعاً نمی داند که معیارها باید چه باشند. برای پیشرفت در حرفه خود، باید مدیر خود را متقاعد کنید که آماده هستید و با شانس، مدیر شما می تواند برای ارتقای شما تأییدیه بگیرد. نکته مثبت این است که اگر تیم در نهایت رشد کند، به سرعت به یک فرد ارشد در تیم تبدیل
خواهید شد. از آنجایی که تیم علم داده گزارشها و مدلهایی را برای بخشهای سراسر شرکت (مانند بازاریابی، زنجیره تامین و مراقبت از مشتری) ارائه میکند، اعضای تیم علم داده کاملاً شناخته شده هستند. این واقعیت به تیم احترام زیادی در داخل شرکت داده است و به نوبه خود، تیم علم داده رفاقت زیادی در درون خود دارد. ترکیبی از اندازه تیم و سطح نفوذ در شرکت به دانشمندان داده اجازه می دهد تا نفوذ بسیار بیشتری نسبت به سایر شرکت ها داشته باشند. برای فردی در تیم علم داده غیرعادی نیست که با مدیران سطح بالا ملاقات کند و در گفتگو مشارکت داشته باشد.
2.2 فناوری شما: یک فناوری قدیمی که شروع به تغییر کرده است
جمله رایجی که هنگام صحبت در مورد فناوری در HandbagLOVE می شنوید این است: “خب، همیشه همین طور بوده است.” اطلاعات سفارش و مشتری در پایگاه داده Oracle ذخیره می شود که مستقیماً به فناوری صندوق پول متصل است و طی 20 سال تغییر نکرده است. این سیستم به خوبی از محدودیت های خود عبور کرده است و تغییرات زیادی روی آن اعمال شده است. تمام آنچه گفته شد، سیستم هنوز کار می کند. سایر دادهها نیز در پایگاه داده مرکزی جمع آوری و ذخیره میشوند: دادههای جمع آوری شده از وبسایت، داده های تماس های مراقبت از مشتری، و دادههای تبلیغاتی و ایمیلهای بازاریابی.
همه این سرورها در محل هستند ( on-prem )، نه در فضای ابری، و یک تیم فناوری اطلاعات آنها را حفظ می کند. با ذخیره کردن تمام داده ها در یک سرور بزرگ، شما این آزادی را دارید که هر طور که می خواهید به داده ها متصل شوید و به آنها بپیوندید. و اگرچه گاهی اوقات queries شما برای همیشه طول می کشد. یا سیستم را بیش از حد بارگذاری می کند، معمولاً می توانید راه حلی بیابید تا چیزی قابل استفاده به دست آورید. اکثریت قریب به اتفاق آنالیزها بر روی لپ تاپ شما انجام می شود. اگر برای آموزش یک مدل به کامپیوتری قدرتمندتر نیاز دارید، تهیه آن مشکل ساز است. این شرکت پشته فناوری یادگیری ماشین ندارد زیرا هیچ یادگیری ماشین داخلی ندارد.
2.3 مزایا و معایب HandbagLOVE
با حضور در HandbagLOVE ، شما تأثیر و توانایی زیادی برای انجام کاری که فکر می کنید عاقلانه است دارید. شما می توانید از پیشنهاد ایجاد یک مدل ارزش در طول عمر مشتری، ساختن آن و استفاده از آن در شرکت بدون نیاز به متقاعد کردن افراد زیادی برای اجرای ایده خود استفاده کنید. این آزادی که ناشی از ترکیبی ازاندازه شرکت و جدید بودن علم داده بسیار ارزشمند است. شما به طرز باورنکردنی برای انجام کاری که فکر می کنید بهترین است قدرت دارید. نقطه ضعف این قدرت این است که افراد زیادی برای کمک گرفتن ندارید. شما مسئول یافتن راهی برای انجام کارها یا مقابله با عواقب زمانی هستید که همه چیز کار نمی کند.
پشته فناوری قدیمی است، و شما باید زمان زیادی را صرف راه حلهایی برای آن کنید، که استفاده خوبی از زمان نیست. ممکن است بخواهید از یک فناوری جدیدتر برای ذخیره داده ها یا مدل های در حال اجرا استفاده کنید، اما پشتیبانی فنی برای انجام آن را نخواهید داشت.
اگر نمیتوانید هیچ فناوری جدیدی را به طور کامل راه اندازی کنید، فقط باید بدون استفاده از آن از پس آن برآیید.
دستمزد یک دانشمند داده به اندازه شرکت های بزرگتر، به ویژه شرکت های فناوری، بالا نخواهد بود.
HandbagLOVE فقط پول نقدی برای پرداخت چک های دستمزد بالای علم داده را ندارد. علاوه بر این، شرکت به هر حال به بهترین ها نیاز ندارد – فقط افرادی که می توانند اصول اولیه را انجام دهند. همانطور که گفته شد، حقوق وحشتناک نخواهد بود. مطمئناً بسیار بالاتر از آن چیزی است که اکثر افراد در شرکت با سالها تجربه مشابه می سازند. HandbagLOVE یک شرکت خوب برای کار برای دانشمندان داده است که از داشتن آزادی انجام کاری که فکر می کنند. درست است هیجان زده هستند اما شاید علاقه ای به استفاده از پیشرفته ترین روش ها ندارند. اگر با استفاده از روشهای آماری استاندارد و تهیه گزارشهای معمولی راحت هستید، HandbagLOVE باید مکانی راحت برای رشد شغلی شما باشد. اگر واقعاً فقط به استفاده از روشهای یادگیری
ماشین پیشرفته علاقه دارید، پروژههای زیادی برای انجام در HandbagLOVE پیدا نخواهید کرد. همچنین افراد زیادی را در آنجا پیدا نخواهید کرد که چیزی در مورد آنچه شما در مورد آن صحبت می کنید بدانند.