Data Scientist — це людина, яка працює з великими обсягами даних. Просто з величезними. Цей фахівець вміє їх добувати, аналізувати, а головне — обробляти.

Data Scientist — людина з відмінними математичними та аналітичними здібностями, і зовсім необов’язково це повинен бути тільки програміст. Найчастіше цей напрямок цікавий фахівцям з прикладної математики та статистики, а також аналітикам. Фахівець розуміє, в якому вигляді дані сприйме комп’ютер і надає йому їх. Таким чином, комп’ютер може отримати цінну інформацію з даних і використовувати її на благо. Наприклад, на Data Science засновані Self-driving cars, персоналізовані інтерфейси, медична система IBM Watson, підказки на ресурсах типу Aliexpress, Amazon, Netflix.

Data Scientist працює з даними з різних джерел: збирає їх, структурує, виділяє і синтезує. Для нього важливо забезпечувати висновки та ухвалювати дії, засновані на зібраних даних. У своїй роботі фахівець використовує різні мови програмування — SAS, R і Python, а також аналітичні методи. Працюючи з великими даними, не можна обійтися без статистики, тому спеціаліст займається ще й статистичними тестами.

Такий фахівець має бути готовий до наполегливої ​​роботи, адже йому постійно треба шукати ідеальну формулу для навчання штучного інтелекту. До того ж, часто немає очевидного вирішення проблеми, тому серед всіх алгоритмів фахівцям доводиться підшукувати відповідний під конкретну задачу.

Які навички потрібні Data Scientist-у:

  • знання мови програмування SAS, R або Python;
  • дискретна математика, статистика і статистичний аналіз;
  • знання бази даних MySQL і Postgres;
  • фреймворк розподілених обчислень Hadoop MapReduce;
  • алгоритми Machine Learning;
  • високий рівень комунікаці;.
  • технології візуалізації даних і звітності;
  • розуміння предметної області;
  • знання англійської буде перевагою.

Переваги в роботі Data Scientist-а:

  • творча робота з великою свободою дій;
  • багаточисельне ком’юніті, де можна прокачати свій рівень;
  • необов’язково бути програмістом, щоб почати свою кар’єру в цій області;
  • перспективна і затребувана професія в сучасних IT-реаліях.
  • можна працювати як в офісі, так і віддалено.

З початку 2010-х років Data Scientist вважається однією з найпривабливіших, високооплачуваних і перспективних професій. І це не дивно. Прогресивна сфера IT не може обійтися без такої знахідки, як робота з даними. А отже, кількість проєктів, де потрібні Data Scientists буде тільки рости. Більш того, деякі компанії вже створили відділи по Data Science / Machine Learning і розвивають цю послугу.

Навчають таких фахівців на факультеті прикладної математики у виші. Але зверніть увагу на програму: вам знадобляться дисципліни, пов’язані зі статистикою, лінійна алгебра, теорія ймовірності, а також мови програмування Python і R.

Самонавчання — але за умови, що у вас вже є якась база. Для того, щоб заглибитися в суть того, що відбувається, потрібна людина, яка могла б доступно і зрозуміло все розкласти по поличках. Тому отримати базові знання можна на курсах.

Якщо ви вже добре розбираєтеся у вищій математиці і статистиці, скористайтеся онлайн-ресурсами та відеокурсами на YouTube. І не забувайте ставити ваші запитання в ком’юніті.