Файнтюнинг на примере Llama 3 + QLoRA. ПРОЩЕ и ЭФФЕКТИВНЕЕ чем когда-либо

Sdílet
Vložit
  • čas přidán 27. 04. 2024
  • В этом видео я показываю, как выполнить файнтюнинг Llama 3 максимально просто, как настроить GPU и программный стек.
    💻 immers.cloud - широкий выбор карт для обучения и инференса нейронных сетей: immers.cloud/signup/r/2024042...
    Один из ведущих поставщиков услуг IaaS (Infrastructure as a Service) в России, специализирующийся на использовании графических процессоров (GPU).
    Сервис предлагает конкурентоспособные цены и интуитивно понятный интерфейс, который даже начинающие пользователи могут легко освоить и начать работу с необходимым программным обеспечением.
    💻 gptchain - фреймворк для быстрого развертывания AI-ассистентов: github.com/RuslanPeresy/gptchain
    Поддерживает интеграцию с Telegram-ботом, Retrieval Augmented Generation (RAG), деплой моделей на LLM сервер и файнтюнинг LLM на собственных данных.
    Телеграм-канал: t.me/ruslandevlive
    Дискорд: / discord
    🤗 Веса моей модели: huggingface.co/ruslandev/llam...
    В карточке модели - гиперпараметры, которые я использовал при файнтюнинге, и формат моего промпта, а также метрики обучения.
    Это описание содержит реферальные ссылки.
  • Věda a technologie

Komentáře • 45

  • @ruslandev
    @ruslandev  Před měsícem +1

    Вышла новая часть - Файнтюнинг и квантизация Llama-3-70B czcams.com/video/ML4M1UQHxbU/video.html
    Я обучил самую большую пока Ламу на мультиязычном датасете, и она начала следовать инструкциям на русском.
    А также я показал процесс квантизации модели с сохранением в формат gguf.

  • @user-cc2lp9tz7r
    @user-cc2lp9tz7r Před 2 měsíci +19

    Честно говоря я ожидал большего. В начале видоса был радостный возглас: "наконец-то мы получили модель сопоставимую по качеству с GPT-4"!!! Речь шла конечно о Llama-3-70b И потом автор с покер-фейсом просто берёт для своего фантюнинга модель Llama-3-8b-4bit. То есть не только модель в на порядок меньше так ещё и квантизованую по самое нибалуйся. Я ожидал увидеть процесс обучения 70b квантизованой до 8 бит модели на A100 GPU камне и понять примерно сколько времени это может занять. И дообучать чему-то полезному например вопросам и ответам на русском языке. В этом видосе кстати сам процесс обучения скипнут хотя это самое интересное можно было показать минуту начала и минуту конца. Просто так скипать весь процесс это не правильно потому что ради этого процесса все эти подготовительные танцы с бубном и проделывались.

    • @TheMr0day
      @TheMr0day Před 2 měsíci +6

      Согласен. Тоже хотелось бы увидеть работу с моделью 70B и обучение на русском датасете, потому что инференс на русском языке у llama 3 из коробки местами весьма корявенький (по крайней мере, то, что я увидел на 8B). Если аренда ресурсов под обучение 70B окажется довольно дорогой по стоимости, то показать хотя бы расчеты и минимально необходимые ресурсы для запуска.
      В любом случае, ролик полезен и автору спасибо за то, что делится знаниями! Квантизацию и конвертацию в GGUF тоже ждем.

  • @MultiAccordionman
    @MultiAccordionman Před 2 měsíci +8

    Спасибо большое за ролик. Было бы здорово увидеть ролик про квантизацию и разбор Вашей библиотеки.

  • @kirillkirilenkov9610
    @kirillkirilenkov9610 Před 2 měsíci +7

    Квантизацию модели с последующей конвертацией в GGUF поддерживаю.

  • @user-nq8cm3li4o
    @user-nq8cm3li4o Před 2 měsíci +4

    Было бы ещё Здорово эту модель залить на хостинг через фласк или Джанго чтобы она там отвечала на вопросы,(конечно в закрытом режиме для безопасности) также было бы интересно посмотреть как реализовывается Telegram бот с её помощью, конечно после того как квантизация будет сделана. Думаю что это были бы очень ценные ролики для многих.

  • @infomed100
    @infomed100 Před 2 měsíci +2

    Квантизацию модели с последующей конвертацией в GGUF поддерживаю!

  • @150vit
    @150vit Před 2 měsíci +2

    Квантизация очень интересна! И не сколько для мобильных устройств, сколько запуск тяжёлых моделей (70-30B) на 24Gb видеокартах, Tesla P40, например. Запуск на нескольких видеокартах, оптимизация под разные архитектуры...

  • @user-xt4wr5do5z
    @user-xt4wr5do5z Před měsícem

    Хорошее видео, спасибо! Интересно увидеть продолжение видео.

  • @leoniddzhabiev
    @leoniddzhabiev Před měsícem

    спасибо. это нужное видео

  • @user-rc6ze3ue3v
    @user-rc6ze3ue3v Před měsícem

    Привет 👋 было бы круто если бы она в конце ответа не как обычно говорила бы чем ещё помочь а сначала бы предложила свой собственный вопрос для продления темы которая рассказывала только что, что бы вопрос её был на столько интересным от которого не возможно было-бы удержатся и сказать ей , да я хочу знать ответ на этот вопрос , тем самым она могла бы затягивать общение все глубже и обширней в той теме которая началась из начально !)

  • @user-sy5mv8cu7v
    @user-sy5mv8cu7v Před měsícem

    Да это интересно. Спасибо за Вашу работу.

  • @user-qv6ph1bt6l
    @user-qv6ph1bt6l Před měsícem

    Мужик спасибо. Давно хотел что-то подобное 🔥

  • @sergeykartyshov2846
    @sergeykartyshov2846 Před 2 měsíci

    Спасибо, очень интересно. Квантизацию поддерживаю. Интересно познакомиться поближе с библиотекой.

  • @snowiedigga
    @snowiedigga Před měsícem

    Интересно, продолжай в том же духе 👍

  • @user-gq4vu5zk5i
    @user-gq4vu5zk5i Před 2 měsíci +1

    Интересно! И ещё полную подготовку датасета для обучения.
    А если обучить на своём датасете по определённому домену, насколько хорошо она будет отвечать по этому домену без подгрузки контекста

  • @userpupkin499
    @userpupkin499 Před 2 měsíci +1

    Спасибо за видео. Да, интерересно было бы продолжение с получением gguf

  • @ValentinYefimov
    @ValentinYefimov Před měsícem

    Да. Очень интересно! Продолжи пожалуйста по квантизацию и создание gguf

  • @softgpt
    @softgpt Před měsícem

    Всё интересно, квантизация тоже, но также интересует дообучение модели и практические рекомендации по сбору хорошего датасета для русского языка

  • @user-hq8rd2ol9k
    @user-hq8rd2ol9k Před 2 měsíci +1

    Добрый день! Было бы очень интересно как вы конвертируете модель в формат для TensorRT и запускаете её, собственно на TensorRT. Особенно интересно было бы измерить прирост в скорости.

  • @jonymnimonik-ff7dg
    @jonymnimonik-ff7dg Před 2 měsíci +1

    Да , интересно

  • @user-sc4cs9sp6g
    @user-sc4cs9sp6g Před měsícem

    Первое предложение автору. Если тебе не хватает денег на те или иные эксперименты, то предлагаю делать краудфандинг. Можно прям тут на ютубе - типа хотите посмотреть на файн-тюнинг и квантизацию llama 3 70b - скидывайте бабосы

  • @2009Spread
    @2009Spread Před 2 měsíci +2

    Сколько ресурсов ест в процессе обучения, и сколько когда модель готова . Есть метрики?

  • @mr.grixakrushkas5667
    @mr.grixakrushkas5667 Před 2 měsíci +1

    Было бы интересно про метрики и сравнение качества моделей, а то на глаз такое себе. Вдруг при обучении она позабыла все.

  • @Ad-rc4dy
    @Ad-rc4dy Před 2 měsíci +1

    Отличное видео, спасибо!Можете подсказать какие ещё есть популярные датасеты для файнтюнинга кроме Саманты и их предназначение

    • @ruslandev
      @ruslandev  Před 2 měsíci

      Dolphin - uncensored датасет от того же разработчика. В целом много чего есть на HF

  • @user-sc4cs9sp6g
    @user-sc4cs9sp6g Před měsícem

    Можешь показать, как сделать автономный, эффективный переводчик (чем больше языков, тем лучше, но для начала русский- английский хватило бы)? Какую модель лучше использовать и как?

  • @galandec2000
    @galandec2000 Před měsícem

    Да, было бы интересно. Так же было бы интересно стоимости на подобные обучения. и цены на развертывание обученных моделей. к примеру Llama3 8B и Llama3 70B в какую сумму влетит если развернуть на данном сервисе?
    Заранее спасибо!

  • @goga-pro2024
    @goga-pro2024 Před měsícem

    да хотим увидеть квантилизацию

  • @noino5458
    @noino5458 Před měsícem

    Было бы интересно получить инструкцию по дообучения на своих данных. Например у меня есть excel таблица с данными, скормили эту таблицу LLM, а она после отвечает по таблице. Такое возможно?

    • @vlad-n-ag
      @vlad-n-ag Před měsícem

      Это возможно и уже реализовано в некоторых сервисах на основе LLM. Думаю они для этого могут не дообучать исходную модель, а конвертировать данные в векторную форму и хранить в векторной базе данных. Сервис, получая запрос пользователя, выполняет поиск в базе данных и передаёт близкие по смыслу вложения в качестве подсказки модели. На основе запроса, подсказки и собственных данных, модель формирует ответ.

  • @barkalov
    @barkalov Před 2 měsíci

    Интересно запустить инференс на чем-нибудь вроде Raspberry pi

  • @newocom
    @newocom Před 2 měsíci

    Так, дуже цікаво!

  • @alnibl
    @alnibl Před 5 dny

    Здравствуйте! Подскажите пожалуйста, какая лучше модель llm подойдет для задачи вытаскивания из текста названия книги, автора, года и издательства. Текст подается в промте, но он с ошибками и неточностями, так как распознается по фото книги моделью ocr)

    • @ruslandev
      @ruslandev  Před dnem +1

      можно поискать на Huggingface модели для задач Named Entity Recognition. Но вообще любая LLM уровня GPT-3.5 и выше для этого подойдет

  • @goradiog8145
    @goradiog8145 Před 2 měsíci +1

    Как обучить whisper? Нигде не могу найти видео на эту тему. Мне постоянно необходимо расшифровывать аудиозаписи в текст. Необученный whisper плохо работает с русским языком. Хотелось бы допилить модель, но не знаю как.

    • @user-cc2lp9tz7r
      @user-cc2lp9tz7r Před 2 měsíci +1

      попробуй Silero она лучше русский распознаёт

    • @ruslandev
      @ruslandev  Před 2 měsíci +2

      на HF в разделе automatic speech recognition есть файнтюнинг-версии whisper, некоторые с кодом

  • @toto_ro_ro
    @toto_ro_ro Před měsícem

    Добрый день а вашу модель можно скачать и потестить на мак ос в ml studio?

    • @toto_ro_ro
      @toto_ro_ro Před měsícem

      Там как раз вроде бы guff если не ошибаюсь

    • @ruslandev
      @ruslandev  Před měsícem +1

      Следующее видео про квантизацию, файл gguf из него - на моем Huggingface

    • @toto_ro_ro
      @toto_ro_ro Před měsícem

      @@ruslandev спасиб

  • @pacman777
    @pacman777 Před 22 dny

    привет,
    hi, it's not clear. This is probably an advertisement for those in the know.нихера непонятно. Наверно это реклама или что?

  • @unzerror8208
    @unzerror8208 Před měsícem

    Квантизацию модели с последующей конвертацией в GGUF поддерживаю.