Dev & Data Science

NLP Beginning

На практиці вчимося вирішувати завдання, пов'язані з обробкою текстової інформації. Від основ до перших практичних кейсів.

Про курс

Під час навчання на курсі ви зрозумієте природу текстових даних та як їх збирати, зберігати й аналізувати. Дізнаєтесь про різні методи попередньої обробки тексту та про те, які є підходи до аналізу тексту загалом. Зрозумієте, для яких NLP задач найефективніше застосовувати ML підходи, а для яких — систему правил.

На практиці ви самостійно створите, обробите і проаналізуєте дані, а також реалізуєте власний продакшн сервіс для вирішення NLP завдання. Ви не тільки опануєте основні навички, необхідні для обробки природної мови, а й освоїте найпопулярніші бібліотеки та технології для реалізації NLP рішень.

Бонусом курсу буде інформація про те, як і де шукати свою першу роботу комплінгвіста та як успішно пройти співбесіду.

27 травня 2023 курс триває 3 місяці
10 000 грн/міс. 30 000 грн при повній оплаті курсу
10 500 грн/міс. при оплаті частинами
15 місць кожен студент отримує регулярний фідбек від куратора

Кураторки

Авторка програми Наталя Аванесова
Кураторка Ніка Сніжко
Кураторка Валерія Білоус



Програма курсу

  • NLP у реальному світі

    • — Що таке NLP/NLU/NLG/NLI.
    • — Для рішення яких бізнес задач використовуються техніки та методи NLP. Найтрендовіші NLP завдання останніх років.
    • — Якими бувають цикли сучасних NLP проєктів.
    • — Якою може бути команда NLP проєкту та що представляють собою щоденні задачі комплінгвістів/NLP інженерів.
    • — Які навички та вміння необхідні комплінгвістам/NLP інженерам, щоб бути ефективними в команді.
  • Data Mining

    • — Які типи даних існують та які їхні особливості.
    • — Де взяти дані.
    • — Як зберігати дані.
    • — Чому комплінгвісту потрібно знати SQL.
  • Переваги Python для аналізу текстових даних

    • — Чому саме Python.
    • — Які Python-хаки найкраще підходять для маніпуляцій із текстом.
    • — Які найпопулярніші NLP інструменти та бібліотеки для обробки текстових даних.
  • Попередня обробка тексту

    • — Принцип GIGO. Чому важливий етап предопрацювання.
    • — Чим відрізняється препроцесинг структурованих текстів від відгуків. Як з ними працювати.
    • — Які техніки для предопрацювання існують.
    • — Як знати, коли предопрацювання завершене.
  • Обробка текстових даних: від рівня слова до семантичного аналізу

    • — Регулярні вислови.
    • — N-grams та яке їхнє застосування в NLU задачах.
    • — Техніки синтаксичного аналізу тексту.
    • — Part-of-speech (POS) tagging.
    • — Що таке парсинг.
    • — Граматика незалежних складників і залежностей. У чому різниця та для яких задач використовуються.
    • — Техніки семантичного аналізу.
    • — Co-reference resolution (анафора).
    • — Word sense disambiguation (багатозначність слів).
    • — Named entity recognition (розпізнання іменованих сутностей).
    • — Онтологія та інструменти для її створення + Semantic role labeling (смислова анотація слів).
  • Машинне навчання для NLP

    • — Які бізнес завдання можна вирішити за допомогою алгоритмів ML.
    • — Типи машинного навчання.
    • — Базові алгоритми ML.
    • — Класичний ML/NLP pipeline.
    • — Як підготувати дані для машинного навчання та на що звернути особливу увагу.
    • — Метрики якості результатів моделей.
    • — Confusion Matrix/Accuracy/Precision and Recall.
  • Текстова репрезентація

    • — Що таке вектори та для чого вони потрібні.
    • — Bag of words.
    • — TF-DF.
    • — Bag of N-grams.
    • — Word embedding.
  • Тематичне моделювання

    • — Що таке тематичні моделі та якими вони бувають.
    • — Метод латентного розміщення Діріхле.
    • — Тематичне моделювання коротких текстів.
  • Класифікація тексту

    • — Класифікація на основі правил.
    • — Машинне навчання із вчителем для класифікації тексту.
    • — Машинне навчання без вчителя для класифікації тексту.
  • Підходи на основі правил проти машинного навчання

    • — Переваги та недоліки кожного з підходів.
    • — Що коли обрати.
  • Як знайти першу роботу й успішно пройти співбесіду

    • — Як отримати свою першу роботу в NLP та як найкраще підготуватися до співбесіди.
    • — Чекліст топових запитань для співбесіди.

Курс для вас, якщо ви

Філолог, лінгвіст

знаєте основи Python та хочете поєднати все це, працюючи з NLP

Комп’ютерний лінгвіст

рівня Junior/Middle low, Data Scientist, уже працюєте з NLP та відчуваєте потребу зміцнити базу

Python програміст

хочете освоїти Natural Language Processing

Досвід

базове розуміння Python (змінні, цикли, функції).

Час

10-12+ годин на тиждень для виконання домашніх завдань

Мова викладання

українська

Як відбувається навчання

Вебінари та відеолекції

Вебінари з куратором та групою будуть проходити щосуботи о 16:00, а відеолекції відкриватимуться щопонеділка та щочетверга.

Real-life завдання

У нас діє Practicult — культ практики. Тому ви будете виконувати багато складної домашки з реальних робочих буднів. Have fun & survive.

Курсовий проєкт

Для проєкту працюватимемо з даними реального замовника. Адже принцип курсу — все як у житті.

Регулярний фідбек

У нас немає базових та преміум режимів. Тільки преміум, завжди. Отримайте від куратора все. І так, десята ітерація — це нормально.

Сертифікат за здобутки

Видаємо лише тим, хто своїм потом, часом і силами його заслужив.

ГРАФІК

Старт

27 травня 2023

Вебінари

щосуботи о 16:00

Відеолекції

щопонеділка та щочетверга

Дізнайтеся більше

Twitter Осередок технарів, Development & Data Science новин, фізри для мозку, непроханих порад та соціально-наукового холівару
Лекція Погані дані як головний ворог ефективного машинного навчання і бюджетів компаній
PROJECTOR MAG Do you speak human language? Або хто такий NLP інженер та чим він займається
PROJECTOR MAG За кафедрою Олександр Руппельт: як будують лінійку Data Science в Projector
Стаття 10 тис. годин, 6 порад. Як увійти у Data Science і не втекти у паніці

Запитання

Чи потрібні якісь навички для вступу на курс?

Це базовий курс для людей без досвіду в галузі, усе потрібне вивчатимемо з нуля. Проте вам знадобиться знання основних понять програмування й базове розуміння Python (змінні, цикли, функції). Також ви повинні володіти англійською на рівні Intermediate і вище.

Ми цінуємо ваш час і хочемо, щоб навчання було для вас релевантним. Тому після реєстрації надішлемо коротку анкету. Вона допоможе кураторові дізнатися про ваш попередній досвід, а також оцінити мотивацію й загальне розуміння галузі.

Якщо все добре –– ми вам одразу повідомимо про зарахування. А за кілька днів до старту курсу надішлемо лист з інформацією про процес навчання. Важливо: місце в групі бронюється тільки після внесення оплати.

Якщо ви отримаєте відмову –– не засмучуйтеся. Ми надішлемо також список корисних посилань. Ознайомтеся з цими матеріалами, а відтак сміливо подавайтеся на курс знову.

З яким софтом будемо працювати на курсі?

Для роботи знадобиться Anaconda Notebooks, а вебінари проходитимуть на платформі Zoom.

Чи можна дивитися заняття в будь-який зручний день?

Можна, але важливо встигати виконувати домашні завдання, які ви будете отримувати щотижня.

Як відбувається комунікація на курсі та в якому форматі куратор дає фідбек?

Уся комунікація на курсі відбуватиметься через платформу Slack (робочий чат групи, канали для домашніх завдань і корисних посилань). Куратор дає фідбек у вигляді коментарів до домашніх завдань і обговорення на вебінарах.

Чи будуть мені доступні відеозаписи лекцій після завершення курсу?

Доступ до архіву випускника зберігається на 3 роки від моменту старту курсу.

А сертифікат буде?

Ви отримаєте сертифікат, якщо виконуватимете домашні завдання та захистите курсовий проєкт.

Що, якщо мені не сподобається?

Ми зможемо повернути гроші протягом 7 днів від дати старту курсу, якщо ви передумаєте.

Хто такий NLP інженер?

Natural Language Processing (NLP) — це обробка природної мови. NLP інженери — люди, які розробляють продукти, що пов'язані з обробкою природної мови.

Також ви могли чути назву «комп’ютерний лінгвіст». Так інакше називають професію NLP інженера. Якщо спробувати визначити різницю між цими термінами, то дуже умовно можна виокремити одну розбіжність: комп’ютерний лінгвіст має ширшу експертизу в мовознавстві та теорії, а NLP інженер — більше технічного, програмного бекграунду.

Із якими продуктами працюють NLP спеціалісти?

Будь-який аналіз, розуміння, синтез природної мови (письмової чи усної) — це все natural language processing (NLP). Серед реальних прикладів можна виділити такі:
— машинний переклад;
— побудова чатботів — запитання/відповідь;
— розробка голосових помічників на кшталт Alexa чи Siri;
— обробка великих обсягів текстових даних і видобування з них необхідної інформації;
— аналіз відгуків користувачів, зокрема їхня класифікація — позитивний чи негативний, про сервіс чи про ціну тощо.

Реєстрація

Ще маєте запитання?
Не соромтесь їх ставити.

Проконсультуйте мене