Синтез та розпізнавання мовлення | Єгор Смоляков, CEO UA-LAWYER | AI HOUSE Podcast #19
Vložit
- čas přidán 18. 06. 2024
- У новому епізоді AI HOUSE Podcast до нас завітав Єгор Смоляков. З ним поговорили про: синтез та розпізнавання української мови, чому Whisper гарний в роботі, як та скільки потрібно записувати аудіо для датасету, а ще про те, як робити розпізнавання мов, для яких замало даних. Також обговорили нюанси роботи з LLM для юридичної теми, використання моделі від TikTok, LLM від X (Twitter), хакатон від Нової Пошти, а також датасет з кримськотатарської мови від Respeecher.
Долучайтесь до нашого AI-ком’юніті: t.me/AIHOUSE
Підписуйтесь на наш CZcams-канал та клікайте на дзвінок, щоб першими дивитися нові випуски 👉 @aihouse_ukraine
Посилання на благодійну організацію «Реактивна пошта»: reactivepost.org/
Спікери:
Гість - Єгор Смоляков, CEO UA-LAWYER / / yehor-smoliakov
Ведучий - Роман Кислий, Research Data Scientist у Visa / / roman.kyslyi
Слухайте AI HOUSE Podcast на інших платформах: bit.ly/m/AI-HOUSE-Podcast
Корисні посилання:
- Discord: / discord
- GitHub: github.com/egorsmkv/speech-re...
Спільноти Єгора:
- t.me/speech_recognition_uk
- t.me/speech_synthesis_uk
- t.me/computer_vision_uk
- t.me/applied_math_uk
- t.me/nlp_uk
Додаткові рекомендації по випусках:
- Випуск з Мар’яною Романишин про малоресурсні мови: • Про AI в природній мов...
- Випуск з Олексієм Сивоконем про дистиляцію даних: • Про AI, майбутнє NLP т...
- Про RAG: • Large Language Models ...
Таймкоди:
00:00 - Інтро
00:53 - Знайомство з Єгором
01:42 - З чого Єгор зайшов у АІ
04:31 - Як збирали перший великий датасет української мови
09:17 - Про еволюцію технологій
12:00 - На якому етапі зараз розпізнавання?
14:35 - Що робити, якщо хочемо зробити розпізнавання голосу на edge девайсі?
15:49 - Про Сема Альтмана та термоядерний синтез
16:20 - Куди розпізнавання привело Єгора?
18:20 - Про LLM в UA-LAWYER
21:00 - Що таке RAG?
22:42 - Кейс про LLM від Х (Twitter)
23:55 - Щодо законодавства та LLM
25:48 - Про синтез
32:34 - Як збирати дані?
34:15 - Скільки потрібно записаного матеріалу для синтезу?
35:19 - Що робити, якщо запис із шумами?
36:26 - Про діпфейки
38:02 - Що робити з суржиком і діалектом?
39:12 - Як все змінилось з появою Whisper?
40:46 - Які проблеми є у Whisper?
43:00 - Дистиляція даних
44:20 - Про роботу з моделями з сорані, індонезійської та гаїтянської мов
46:20 - Як робити розпізнавання мов для яких замало даних?
47:02 - Respeecher і датасет з кримськотатарської
49:25 - Про «Бот Тарас»
52:30 - Мовна модель TikTok
54:08 - TikTok для просування UA-LAWYER
55:31 - Про хакатон від Нової Пошти
01:05:19 - Чому варто прописувати обмеження на хакатонах і челенджах?
01:06:20 - Зустрічі про ML, CV, NLP та Quantum computing
01:08:48 - Бліц
Про AI HOUSE
AI HOUSE - це найбільше та найпотужніше АІ-комʼюніті в Україні. Ми обмінюємося досвідом і знаннями, здобуваємо навички, реалізовуємо нові технологічні та бізнесові ідеї, розвиваємо індустрію ШІ та сприяємо народженню продуктових AI-стартапів вдома, в Україні.
Долучайтеся до нашого комʼюніті:
Facebook: / aihouse.ukraine
Instagram: / aihouse.ukraine
Twitter: / aihouse_ukraine
Telegram-чат для спілкування: t.me/aihousechat
Телеграм-канал: t.me/AIHOUSE
Linkedin: / aihouse-ukraine - Věda a technologie
Ви теж здебільшого використовуєте open source рішення?
23:25 пожартував, поржав, сидить щасливий 😂
Прохання зробити щось з мікрофонами, дуже сильно чути плямкання язика і губ.
Дякуємо за фідбек. Спробуємо покращити цей момент)
це трошечки фейспалм, що в подкасті на тему синтезу мов - поганий звук. Не просто трішечки, а я не міг це слухати в навушниках, ставив блютус колонку подалі та слухав
Кляті роботи я вам не вірю!