Синтез та розпізнавання мовлення | Єгор Смоляков, CEO UA-LAWYER | AI HOUSE Podcast #19

Sdílet
Vložit
  • čas přidán 18. 06. 2024
  • У новому епізоді AI HOUSE Podcast до нас завітав Єгор Смоляков. З ним поговорили про: синтез та розпізнавання української мови, чому Whisper гарний в роботі, як та скільки потрібно записувати аудіо для датасету, а ще про те, як робити розпізнавання мов, для яких замало даних. Також обговорили нюанси роботи з LLM для юридичної теми, використання моделі від TikTok, LLM від X (Twitter), хакатон від Нової Пошти, а також датасет з кримськотатарської мови від Respeecher.
    Долучайтесь до нашого AI-ком’юніті: t.me/AIHOUSE
    Підписуйтесь на наш CZcams-канал та клікайте на дзвінок, щоб першими дивитися нові випуски 👉 ‪@aihouse_ukraine‬
    Посилання на благодійну організацію «Реактивна пошта»: reactivepost.org/
    Спікери:
    Гість - Єгор Смоляков, CEO UA-LAWYER / / yehor-smoliakov
    Ведучий - Роман Кислий, Research Data Scientist у Visa / / roman.kyslyi
    Слухайте AI HOUSE Podcast на інших платформах: bit.ly/m/AI-HOUSE-Podcast
    Корисні посилання:
    - Discord: / discord
    - GitHub: github.com/egorsmkv/speech-re...
    Спільноти Єгора:
    - t.me/speech_recognition_uk
    - t.me/speech_synthesis_uk
    - t.me/computer_vision_uk
    - t.me/applied_math_uk
    - t.me/nlp_uk
    Додаткові рекомендації по випусках:
    - Випуск з Мар’яною Романишин про малоресурсні мови: • Про AI в природній мов...
    - Випуск з Олексієм Сивоконем про дистиляцію даних: • Про AI, майбутнє NLP т...
    - Про RAG: • Large Language Models ...
    Таймкоди:
    00:00 - Інтро
    00:53 - Знайомство з Єгором
    01:42 - З чого Єгор зайшов у АІ
    04:31 - Як збирали перший великий датасет української мови
    09:17 - Про еволюцію технологій
    12:00 - На якому етапі зараз розпізнавання?
    14:35 - Що робити, якщо хочемо зробити розпізнавання голосу на edge девайсі?
    15:49 - Про Сема Альтмана та термоядерний синтез
    16:20 - Куди розпізнавання привело Єгора?
    18:20 - Про LLM в UA-LAWYER
    21:00 - Що таке RAG?
    22:42 - Кейс про LLM від Х (Twitter)
    23:55 - Щодо законодавства та LLM
    25:48 - Про синтез
    32:34 - Як збирати дані?
    34:15 - Скільки потрібно записаного матеріалу для синтезу?
    35:19 - Що робити, якщо запис із шумами?
    36:26 - Про діпфейки
    38:02 - Що робити з суржиком і діалектом?
    39:12 - Як все змінилось з появою Whisper?
    40:46 - Які проблеми є у Whisper?
    43:00 - Дистиляція даних
    44:20 - Про роботу з моделями з сорані, індонезійської та гаїтянської мов
    46:20 - Як робити розпізнавання мов для яких замало даних?
    47:02 - Respeecher і датасет з кримськотатарської
    49:25 - Про «Бот Тарас»
    52:30 - Мовна модель TikTok
    54:08 - TikTok для просування UA-LAWYER
    55:31 - Про хакатон від Нової Пошти
    01:05:19 - Чому варто прописувати обмеження на хакатонах і челенджах?
    01:06:20 - Зустрічі про ML, CV, NLP та Quantum computing
    01:08:48 - Бліц
    Про AI HOUSE
    AI HOUSE - це найбільше та найпотужніше АІ-комʼюніті в Україні. Ми обмінюємося досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію ШІ та сприяємо народженню продуктових AI-стартапів вдома, в Україні.
    Долучайтеся до нашого комʼюніті:
    Facebook: / aihouse.ukraine
    Instagram: / aihouse.ukraine
    Twitter: / aihouse_ukraine
    Telegram-чат для спілкування: t.me/aihousechat
    Телеграм-канал: t.me/AIHOUSE
    Linkedin: / aihouse-ukraine
  • Věda a technologie

Komentáře • 6

  • @aihouse_ukraine
    @aihouse_ukraine  Před 2 měsíci

    Ви теж здебільшого використовуєте open source рішення?

  • @user-yz9uw3pd5t
    @user-yz9uw3pd5t Před 2 měsíci +1

    23:25 пожартував, поржав, сидить щасливий 😂

  • @CodeBeep
    @CodeBeep Před 2 měsíci

    Прохання зробити щось з мікрофонами, дуже сильно чути плямкання язика і губ.

    • @aihouse_ukraine
      @aihouse_ukraine  Před 2 měsíci +1

      Дякуємо за фідбек. Спробуємо покращити цей момент)

  • @qwertyntarantino1937
    @qwertyntarantino1937 Před 2 měsíci

    це трошечки фейспалм, що в подкасті на тему синтезу мов - поганий звук. Не просто трішечки, а я не міг це слухати в навушниках, ставив блютус колонку подалі та слухав

  • @user-bd1qd3vv4o
    @user-bd1qd3vv4o Před 2 měsíci

    Кляті роботи я вам не вірю!