Про курс
Під час навчання на курсі ви зрозумієте природу текстових даних та як їх збирати, зберігати й аналізувати. Дізнаєтесь про різні методи попередньої обробки тексту та про те, які є підходи до аналізу тексту загалом. Зрозумієте, для яких NLP задач найефективніше застосовувати ML підходи, а для яких — систему правил.
На практиці ви самостійно створите, обробите і проаналізуєте дані, а також реалізуєте власний продакшн сервіс для вирішення NLP завдання. Ви не тільки опануєте основні навички, необхідні для обробки природної мови, а й освоїте найпопулярніші бібліотеки та технології для реалізації NLP рішень.
Бонусом курсу буде інформація про те, як і де шукати свою першу роботу комплінгвіста та як успішно пройти співбесіду.


10 500 грн/міс. при оплаті частинами

Програма курсу
-
NLP у реальному світі
- — Що таке NLP/NLU/NLG/NLI.
- — Для рішення яких бізнес задач використовуються техніки та методи NLP. Найтрендовіші NLP завдання останніх років.
- — Якими бувають цикли сучасних NLP проєктів.
- — Якою може бути команда NLP проєкту та що представляють собою щоденні задачі комплінгвістів/NLP інженерів.
- — Які навички та вміння необхідні комплінгвістам/NLP інженерам, щоб бути ефективними в команді.
-
Data Mining
- — Які типи даних існують та які їхні особливості.
- — Де взяти дані.
- — Як зберігати дані.
- — Чому комплінгвісту потрібно знати SQL.
-
Переваги Python для аналізу текстових даних
- — Чому саме Python.
- — Які Python-хаки найкраще підходять для маніпуляцій із текстом.
- — Які найпопулярніші NLP інструменти та бібліотеки для обробки текстових даних.
-
Попередня обробка тексту
- — Принцип GIGO. Чому важливий етап предопрацювання.
- — Чим відрізняється препроцесинг структурованих текстів від відгуків. Як з ними працювати.
- — Які техніки для предопрацювання існують.
- — Як знати, коли предопрацювання завершене.
-
Обробка текстових даних: від рівня слова до семантичного аналізу
- — Регулярні вислови.
- — N-grams та яке їхнє застосування в NLU задачах.
- — Техніки синтаксичного аналізу тексту.
- — Part-of-speech (POS) tagging.
- — Що таке парсинг.
- — Граматика незалежних складників і залежностей. У чому різниця та для яких задач використовуються.
- — Техніки семантичного аналізу.
- — Co-reference resolution (анафора).
- — Word sense disambiguation (багатозначність слів).
- — Named entity recognition (розпізнання іменованих сутностей).
- — Онтологія та інструменти для її створення + Semantic role labeling (смислова анотація слів).
-
Машинне навчання для NLP
- — Які бізнес завдання можна вирішити за допомогою алгоритмів ML.
- — Типи машинного навчання.
- — Базові алгоритми ML.
- — Класичний ML/NLP pipeline.
- — Як підготувати дані для машинного навчання та на що звернути особливу увагу.
- — Метрики якості результатів моделей.
- — Confusion Matrix/Accuracy/Precision and Recall.
-
Текстова репрезентація
- — Що таке вектори та для чого вони потрібні.
- — Bag of words.
- — TF-DF.
- — Bag of N-grams.
- — Word embedding.
-
Тематичне моделювання
- — Що таке тематичні моделі та якими вони бувають.
- — Метод латентного розміщення Діріхле.
- — Тематичне моделювання коротких текстів.
-
Класифікація тексту
- — Класифікація на основі правил.
- — Машинне навчання із вчителем для класифікації тексту.
- — Машинне навчання без вчителя для класифікації тексту.
-
Підходи на основі правил проти машинного навчання
- — Переваги та недоліки кожного з підходів.
- — Що коли обрати.
-
Як знайти першу роботу й успішно пройти співбесіду
- — Як отримати свою першу роботу в NLP та як найкраще підготуватися до співбесіди.
- — Чекліст топових запитань для співбесіди.
Курс для вас, якщо ви
Філолог, лінгвіст
знаєте основи Python та хочете поєднати все це, працюючи з NLP
Комп’ютерний лінгвіст
рівня Junior/Middle low, Data Scientist, уже працюєте з NLP та відчуваєте потребу зміцнити базу
Python програміст
хочете освоїти Natural Language Processing
Досвід
базове розуміння Python (змінні, цикли, функції).
Час
10-12+ годин на тиждень для виконання домашніх завдань
Мова викладання
українська
Як відбувається навчання
Вебінари та відеолекції
Вебінари з куратором та групою будуть проходити щосуботи о 16:00, а відеолекції відкриватимуться щопонеділка та щочетверга.
Real-life завдання
У нас діє Practicult — культ практики. Тому ви будете виконувати багато складної домашки з реальних робочих буднів. Have fun & survive.
Курсовий проєкт
Для проєкту працюватимемо з даними реального замовника. Адже принцип курсу — все як у житті.
Регулярний фідбек
У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від куратора все. І так, десята ітерація — це нормально.
Сертифікат за здобутки
Видаємо лише тим, хто своїм потом, часом і силами його заслужив.
ГРАФІК
Старт
27 травня 2023
Вебінари
щосуботи о 16:00
Відеолекції
щопонеділка та щочетверга
Запитання
Чи потрібні якісь навички для вступу на курс?
Це базовий курс для людей без досвіду в галузі, усе потрібне вивчатимемо з нуля. Проте вам знадобиться знання основних понять програмування й базове розуміння Python (змінні, цикли, функції). Також ви повинні володіти англійською на рівні Intermediate і вище.
Ми цінуємо ваш час і хочемо, щоб навчання було для вас релевантним. Тому після реєстрації надішлемо коротку анкету. Вона допоможе кураторові дізнатися про ваш попередній досвід, а також оцінити мотивацію й загальне розуміння галузі.
Якщо все добре –– ми вам одразу повідомимо про зарахування. А за кілька днів до старту курсу надішлемо лист з інформацією про процес навчання. Важливо: місце в групі бронюється тільки після внесення оплати.
Якщо ви отримаєте відмову –– не засмучуйтеся. Ми надішлемо також список корисних посилань. Ознайомтеся з цими матеріалами, а відтак сміливо подавайтеся на курс знову.
З яким софтом будемо працювати на курсі?
Для роботи знадобиться Anaconda Notebooks, а вебінари проходитимуть на платформі Zoom.
Чи можна дивитися заняття в будь-який зручний день?
Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати щотижня.
Як відбувається комунікація на курсі та в якому форматі куратор дає фідбек?
Уся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор дає фідбек у вигляді коментарів до домашніх завдань і обговорення на вебінарах.
Чи будуть мені доступні відеозаписи лекцій після завершення курсу?
Доступ до архіву випускника зберігається на 3 роки від моменту старту курсу.
А сертифікат буде?
Ви отримаєте сертифікат, якщо виконуватимете домашні завдання та захистите курсовий проєкт.
Що, якщо мені не сподобається?
Ми зможемо повернути гроші протягом 7 днів від дати старту курсу, якщо ви передумаєте.
Хто такий NLP інженер?
Natural Language Processing (NLP) — це обробка природної мови. NLP інженери — люди, які розробляють продукти, що пов'язані з обробкою природної мови.
Також ви могли чути назву «комп’ютерний лінгвіст». Так інакше називають професію NLP інженера. Якщо спробувати визначити різницю між цими термінами, то дуже умовно можна виокремити одну розбіжність: комп’ютерний лінгвіст має ширшу експертизу в мовознавстві та теорії, а NLP інженер — більше технічного, програмного бекграунду.
Із якими продуктами працюють NLP спеціалісти?
Будь-який аналіз, розуміння, синтез природної мови (письмової чи усної) — це все natural language processing (NLP). Серед реальних прикладів можна виділити такі:
— машинний переклад;
— побудова чатботів — запитання/відповідь;
— розробка голосових помічників на кшталт Alexa чи Siri;
— обробка великих обсягів текстових даних і видобування з них необхідної інформації;
— аналіз відгуків користувачів, зокрема їхня класифікація — позитивний чи негативний, про сервіс чи про ціну тощо.