Практикум "Вступ до Data Science"
"Вступ до Data Science" — це дводенний практикум, який спрямовано на розвиток базових навичок роботи з даними українських дослідників та спеціалістів із різних галузей, які дозволять їм безболісно отримувати знання з даних. Практикум буде основано на персональному досвіді лектора, а також навчальних матеріалах з серії успішних воркшопів з аналізу даних, що проводить Data Carpentry. Цей практикум було переважно розраховано на людей, котрі ще нічого або майже нічого не знають про аналіз даних, але хотіли б цьому навчитися, щоб почати застосовувати в своїх дослідженнях, у роботі або на заняттях в університеті.
Чому R і RStudio?
R - це одна з найпопулярніших мов програмування, що застосовується в аналізі даних (на рівні з Python), опанування якої не вимагає глибоких знань в програмуванні. Крім того, для полегшення роботи з R, було створено дуже зручний графічний інтерфейс - RStudio, який дозволяє інтерактивно працювати з даними, спостерігаючи результат роботи програми крок за кроком.
Про що саме була мова?
Практикум розпочався з короткого обговорення того, що таке аналіз даних, де він застосовується і навіщо він потрібен. Також у вступній частині ми поговорили про задачу відтворюваності досліджень, яка є однією з основних проблем в сучасній науці. Далі ми перейшли до розгляду базового синтаксису R та принципів роботи в RStudio. Після цього ми розглянули та застосували існуючі способи завантаження даних з різних джерел, їх очистки та зберігання. Учасники дізналися про те, як правильно маніпулювати даними в R: фільтрувати за певною ознакою, підраховувати описові статистики й, нарешті, - візуалізувати результати аналізу за допомогою бібліотеки ggplot2.
В якості прикладів було використано відкриті дані з різних галузей науки, щоб дати найбільш повну картину щодо можливих проблем які можуть виникнути при аналізі різнорідних даних.

Лектор
Дмитро Фішман — науковий співробітник та PhD студент Тартуського Університету в Естонії, дослідник в галузі біоінформатики, член наукової групи “Bioinformatics and Information Technologies” факультету комп’ютерних наук.
Дисертаційні дослідження Дмитра провадяться в галузі обчислювальної імунології, проте, він має досвід роботи в проектах з інших тем, зокрема: персоналізованої медицини, імунопрофілювання хворих на хворобу Альцгеймера, побудови моделей для передбачення псоріазу за концентрацією метаболітів в крові та ін. В університеті Тарту викладає біоінформатику, аналіз даних, машинне навчання та алгоритми. В 2011-2015 рр. - активний учасник та співорганізатор Літньої Школи ААСІМР в Київському Політехнічному Інституті, де займався напрямками, пов’язаними з Data Science та Deep Learning.
Сертифікований інструктор з Data Science в організаціях Data Carpentry та Software Carpentry, які проводять воркшопи для вчених по всьому світу.
Спонсор проекту
Матеріали
Завантажити всі матеріали одним файлом - (28 MiB)
Подяка
Ми вдячні всім хто допоміг нам з організацією цього заходу.
В першу чергу, це компанія Ciklum, на базі якої проходив практикум. Завдяки Ciklum, що покрила витрати на проведення практикуму, участь в ньому була безкоштовна.
Також ми вдячні асистентам лектора, які в дуже короткі строки погодилися на участь у практикумі та зробили можливим запросити більшу кількість учасників:
- Олександра Водоп’янова
- Катерина Багацька
- Тарас Котов
Також ми щиро дякуємо нашим фотографам - Іванці Д'ячук та Олексі Шведу за чудові фотографії, що надовго зберегуть прекрасні емоції та атмосферу заходу.
Фотографії
Решту фотографій можна побачити в альбомі нашої сторінки на Facebook.