Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

Ruslan Dev

zhlédnutí 3 636

Přidat do
- Můj playlist
- Přehrát později
Sdílet

Sdílet

Vložit

Velikost videa:

Zobrazit ovladače přehrávání

Automatické přehrávání

Přehrát

čas přidán 27. 04. 2024
В этом видео я показываю, как выполнить файнтюнинг Llama 3 максимально просто, как настроить GPU и программный стек.
💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/2024042...
Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.
💻 gptchain - фреймворк для быстрого развертывания AI-ассистентов: github.com/RuslanPeresy/gptchain
Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.
Телеграм-канал: t.me/ruslandevlive
Дискорд: / discord
🤗 Веса моей модели: huggingface.co/ruslandev/llam...
В карточке модели - гиперпараметры, которые я использовал при файнтюнинге, и формат моего промпта, а также метрики обучения.
Это описание содержит реферальные ссылки.
Věda a technologie

Komentáře • 45

@ruslandev Před měsícem ⁺¹
Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B czcams.com/video/ML4M1UQHxbU/video.html
Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском.
А также я показал процесс квантизации модели с сохранением в формат gguf.
@user-cc2lp9tz7r Před 2 měsíci ⁺¹⁹
Честно говоря я ожидал большего. В начале видоса был радостный возглас: "наконец-то мы получили модель сопоставимую по качеству с GPT-4"!!! Речь шла конечно о Llama-3-70b И потом автор с покер-фейсом просто берёт для своего фантюнинга модель Llama-3-8b-4bit. То есть не только модель в на порядок меньше так ещё и квантизованую по самое нибалуйся. Я ожидал увидеть процесс обучения 70b квантизованой до 8 бит модели на A100 GPU камне и понять примерно сколько времени это может занять. И дообучать чему-то полезному например вопросам и ответам на русском языке. В этом видосе кстати сам процесс обучения скипнут хотя это самое интересное можно было показать минуту начала и минуту конца. Просто так скипать весь процесс это не правильно потому что ради этого процесса все эти подготовительные танцы с бубном и проделывались.
@TheMr0day Před 2 měsíci ⁺⁶
Согласен. Тоже хотелось бы увидеть работу с моделью 70B и обучение на русском датасете, потому что инференс на русском языке у llama 3 из коробки местами весьма корявенький (по крайней мере, то, что я увидел на 8B). Если аренда ресурсов под обучение 70B окажется довольно дорогой по стоимости, то показать хотя бы расчеты и минимально необходимые ресурсы для запуска.
В любом случае, ролик полезен и автору спасибо за то, что делится знаниями! Квантизацию и конвертацию в GGUF тоже ждем.
@MultiAccordionman Před 2 měsíci ⁺⁸
Спасибо большое за ролик. Было бы здорово увидеть ролик про квантизацию и разбор Вашей библиотеки.
@kirillkirilenkov9610 Před 2 měsíci ⁺⁷
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.
@user-nq8cm3li4o Před 2 měsíci ⁺⁴
Было бы ещё Здорово эту модель залить на хостинг через фласк или Джанго чтобы она там отвечала на вопросы,(конечно в закрытом режиме для безопасности) также было бы интересно посмотреть как реализовывается Telegram бот с её помощью, конечно после того как квантизация будет сделана. Думаю что это были бы очень ценные ролики для многих.
@infomed100 Před 2 měsíci ⁺²
Квантизацию модели с последующей конвертацией в GGUF поддерживаю!
@150vit Před 2 měsíci ⁺²
Квантизация очень интересна! И не сколько для мобильных устройств, сколько запуск тяжёлых моделей (70-30B) на 24Gb видеокартах, Tesla P40, например. Запуск на нескольких видеокартах, оптимизация под разные архитектуры...
@user-xt4wr5do5z Před měsícem
Хорошее видео, спасибо! Интересно увидеть продолжение видео.
@leoniddzhabiev Před měsícem
спасибо. это нужное видео
@user-rc6ze3ue3v Před měsícem
Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)
@user-sy5mv8cu7v Před měsícem
Да это интересно. Спасибо за Вашу работу.
@user-qv6ph1bt6l Před měsícem
Мужик спасибо. Давно хотел что-то подобное 🔥
@sergeykartyshov2846 Před 2 měsíci
Спасибо, очень интересно. Квантизацию поддерживаю. Интересно познакомиться поближе с библиотекой.
@snowiedigga Před měsícem
Интересно, продолжай в том же духе 👍
@user-gq4vu5zk5i Před 2 měsíci ⁺¹
Интересно! И ещё полную подготовку датасета для обучения.
А если обучить на своём датасете по определённому домену, насколько хорошо она будет отвечать по этому домену без подгрузки контекста
@userpupkin499 Před 2 měsíci ⁺¹
Спасибо за видео. Да, интерересно было бы продолжение с получением gguf
@ValentinYefimov Před měsícem
Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf
@softgpt Před měsícem
Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка
@user-hq8rd2ol9k Před 2 měsíci ⁺¹
Добрый день! Было бы очень интересно как вы конвертируете модель в формат для TensorRT и запускаете её, собственно на TensorRT. Особенно интересно было бы измерить прирост в скорости.
@jonymnimonik-ff7dg Před 2 měsíci ⁺¹
Да , интересно
@user-sc4cs9sp6g Před měsícem
Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы
@2009Spread Před 2 měsíci ⁺²
Сколько ресурсов ест в процессе обучения, и сколько когда модель готова . Есть метрики?
@mr.grixakrushkas5667 Před 2 měsíci ⁺¹
Было бы интересно про метрики и сравнение качества моделей, а то на глаз такое себе. Вдруг при обучении она позабыла все.
@Ad-rc4dy Před 2 měsíci ⁺¹
Отличное видео, спасибо!Можете подсказать какие ещё есть популярные датасеты для файнтюнинга кроме Саманты и их предназначение
@ruslandev Před 2 měsíci
Dolphin - uncensored датасет от того же разработчика. В целом много чего есть на HF
@user-sc4cs9sp6g Před měsícem
Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?
@galandec2000 Před měsícem
Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе?
Заранее спасибо!
@goga-pro2024 Před měsícem
да хотим увидеть квантилизацию
@noino5458 Před měsícem
Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?
@vlad-n-ag Před měsícem
Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.
@barkalov Před 2 měsíci
Интересно запустить инференс на чем-нибудь вроде Raspberry pi
@newocom Před 2 měsíci
Так, дуже цікаво!
@alnibl Před 5 dny
Здравствуйте! Подскажите пожалуйста, какая лучше модель llm подойдет для задачи вытаскивания из текста названия книги, автора, года и издательства. Текст подается в промте, но он с ошибками и неточностями, так как распознается по фото книги моделью ocr)
@ruslandev Před dnem ⁺¹
можно поискать на Huggingface модели для задач Named Entity Recognition. Но вообще любая LLM уровня GPT-3.5 и выше для этого подойдет
@goradiog8145 Před 2 měsíci ⁺¹
Как обучить whisper? Нигде не могу найти видео на эту тему. Мне постоянно необходимо расшифровывать аудиозаписи в текст. Необученный whisper плохо работает с русским языком. Хотелось бы допилить модель, но не знаю как.
@user-cc2lp9tz7r Před 2 měsíci ⁺¹
попробуй Silero она лучше русский распознаёт
@ruslandev Před 2 měsíci ⁺²
на HF в разделе automatic speech recognition есть файнтюнинг-версии whisper, некоторые с кодом
@toto_ro_ro Před měsícem
Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?
@toto_ro_ro Před měsícem
Там как раз вроде бы guff если не ошибаюсь
@ruslandev Před měsícem ⁺¹
Следующее видео про квантизацию, файл gguf из него - на моем Huggingface
@toto_ro_ro Před měsícem
@@ruslandev спасиб
@pacman777 Před 22 dny
привет,
hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?
@unzerror8208 Před měsícem
Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

Další v pořadí

Automatické přehrávání