DATALEARN МОДУЛЬ 1-7: АРХИТЕКТУРА АНАЛИТИЧЕСКОГО РЕШЕНИЯ

Sdílet
Vložit
  • čas přidán 7. 09. 2024
  • Дмитрий Аношин затрагивает о архитектуру аналитического решения и рассказывает про 3 основных слоя на примере решения Business Intelligence и Data Warehouse Ламода (Дмитрий работал там еще в 2012/2013):
    📌 Из чего состоит архитектура решения
    📌 3 основных слоя любого аналитического решения
    📌 Слой источников данных
    📌 Слой хранения данных
    📌 Слой доступа к данным
    📌 Говорит о важности SQL
    📌 Пример создания архитектуры в draw.io
    📌 MPP - Massive Parallel Processing - архитектурная особенность аналитических хранилищ данных.
    📌 Business Intelligence, Data Warehouse, ETL/ELT
    📌 OLTP
    Первый модуль введения в инжиниринг данных состоит из 8-ми видео, возможно будет больше.
    В процессе этого модуля мы познакомимся с предметом изучения, узнаем кто такой Data Engineer и что он делает, и как его еще называют. Главное, поймем, как он помогает бизнесу быть эффективней и зарабатывать деньги. Рассмотрим типовые архитектуры аналитических решений
    🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части
    📕 Записывайтесь и проходите курс Инженера Данных.
    ⚠️ КУРС БЕСПЛАТНЫЙ!
    🔗 Записаться вы можете на нашем портале datalearn.ru/
    👍🏻 Запись на курс даст вам возможность не только просматривать видео, но и получить доступ к закрытым материалам, а также возможность выполнять домашние задания, отдавать их на проверку и получить сертификат прохождения курса.
    Telegram канал: t.me/rockyourdata
    Спонсировать: / dmitryanoshin или paypal.me/dmit...

Komentáře • 40

  • @vladimirk.3971
    @vladimirk.3971 Před 4 lety +44

    Добрый день, очень классный курс, но можно, пожалуйста, в начале сделать музыку раза в два тише. Она тогда хотя бы будет совпадать с голосом, который будет после интро. Из ушей почти кровь идёт. Вы молодец, очень познавательно!

    • @dmitryanoshin8004
      @dmitryanoshin8004 Před 4 lety +3

      Со 2го модуля будет микрофон.

    • @vladimirk.3971
      @vladimirk.3971 Před 4 lety +10

      @@dmitryanoshin8004 Дмитрий, спасибо за ответ! Проблема не в вашем микрофоне (хотя да, хотелось бы громче). Проблема в интро. Не знаю как у остальных, у меня звук в винде на 100% плюс на ютубе где-то 60%. Интро по ушам долбит) А потом, когда слушаю ваши лекции (которые очень интересны), выкручиваю на 100%)

    • @dmitryanoshin8004
      @dmitryanoshin8004 Před 4 lety +1

      @@vladimirk.3971 Понял, постараемся отрегулировть.

  • @ivshapovalov
    @ivshapovalov Před 4 lety +23

    Дмитрий, you made my day. "Как только мне дали доступ в 1с, я сразу посмотрел зарплаты сотрудников" :)))) И видимо после этого уволился))))

    • @datalearn4398
      @datalearn4398  Před 4 lety +8

      Да и так было все понятно. Обычный ответ начальника - денег нет, но вы держитесь. Раньше это был не так банально))

    • @truemh
      @truemh Před 3 lety +3

      Начал проходить. Исправьте пожалуйста. Материал все ещё актуальный, а музыка в начале ролика рвёт уши

    • @simexlab2022
      @simexlab2022 Před rokem +2

      Ты поспешил с увольнением. Нужно было увеличить свою З/П 😀

  • @anonimnoplz7228
    @anonimnoplz7228 Před 7 měsíci +1

    Спасибо тебе большое за такой труд! Тяжело отписать словами твой вклад в мою будущую карьеру

  • @regimeku
    @regimeku Před 3 lety +7

    Отличное видео! Супер-полезная базовая информация, которой лично мне, например, очень не хватало при выходе на позицию джуна-аналитика. Конечно, в процессе работы схема в голове нарисовалась, но иметь понимание заранее было бы здорово)

  • @ManticoreRoko
    @ManticoreRoko Před rokem

    Супер курс, очень хочу пройти до конца и все знания впитать в себя. Спасибо

  • @kiraknife657
    @kiraknife657 Před rokem +1

    Очень крутой курс, спасибо. А можно где-то посмотреть дашборд со статусом загрузки данных или хотя бы узнать его структуру?

  • @Re1the
    @Re1the Před 4 lety +1

    👍👍 очень интересно и информативно

  • @goelrengis
    @goelrengis Před rokem

    Спасибо за видео, наглядно.
    Отдельно все вроде понимал про etl, dwh и bi. Но теперь вся картинка сложилась.
    Надеюсь дальше по курсу будет кому в какую область лучше идти. Я пока не понимаю что мне ближе и стоит ли сразу идти в data engineer или сначала через аналитка (продуктового или bi).

  • @goelrengis
    @goelrengis Před rokem

    Спасибо за видео, наглядно.
    Отдельно все вроде понимал про etl, dwh и bi. Но теперь вся картинка сложилась.
    Надеюсь дальше по куру будет кому в какую область лучше идти. Я пока не понимаю что мне ближе и стоит ли сразу идти в data engineer или сначала через аналитка (продуктового или bi).

  • @maceall8106
    @maceall8106 Před 3 lety

    Спасибо за подробное видео!

  • @user-kp6eh4sy4x
    @user-kp6eh4sy4x Před 4 lety +1

    Кстати, очень интересный урок

  • @SunIsland227
    @SunIsland227 Před 4 lety +4

    За юмор :-)👌 на 3:45

  • @anastassiya8526
    @anastassiya8526 Před 4 lety +1

    спасибо, все очень понятно! у нас компания не хочет покупать табло или power bi и прочие системы))) дорого, если on premise, а в клауде работать не хотят с личными сейлс данными) хотя при этом есть сейсфорс))так что я делаю дашборды ручками в питоне и это мука, нужно не только его знать, но и понимать, как построить архитектуру, всякие зависимости между кучей опен-сорсов и я как джун вообще все делаю тыщу лет.time to market огогого какой)

    • @datalearn4398
      @datalearn4398  Před 4 lety

      есть и бесплатные аналоги типа Redash. Стоит попробовать. SQL удобней. А в python я рекомендую посмотреть Dash!

  • @romarus88
    @romarus88 Před 11 měsíci

    Народ, книга "бизнес-аналитика от данных к знаниям" на рутрекере есть, если что.

  • @smbsmn324
    @smbsmn324 Před 3 lety

    Если есть необходимость получать оперативную (в смысле операционную) отчетность, то подключаться напрямую к OLTP, а не к Storage вполне ок, я щетаю. Технически источником данных может быть не "боевая" БД, а "горячий бэкап", например.

    • @user-cs5jd6mn3q
      @user-cs5jd6mn3q Před 3 lety

      Для этого делают отдельную прослойку в виде ODS

  • @evgeny1463
    @evgeny1463 Před 2 lety

    с использованием powerquery в excel все БД тоже обновляются автоматически. Кстати, он может считаться и как ETL, и как DW?

  • @alexandram1460
    @alexandram1460 Před 4 lety

    мне казалось схема строится немного от обратного - от бизнес-задач. то есть, условно, необходимо посмотреть какие-то цифры по покупательской способности разных ЦА, далее подключается специалист разработки, смотрит какие данные собираются сейчас, а что можно использовать в дополнение, далее выбирается BI система и строится хранилища. могу ошибаться...)) поправьте)

    • @datalearn4398
      @datalearn4398  Před 4 lety

      Полностью согласен, все начинается от бизнеса. Возможно я чётко не сказал про это. Просто удобней заполнять мне с лева на право.

    • @user-js9if2uc5r
      @user-js9if2uc5r Před 3 lety

      @@datalearn4398 это разве не разные подходы к моделированию dwh просто?

  • @vladimirk.3971
    @vladimirk.3971 Před 4 lety

    И ещё возник вопрос. Касательно инструментов визуализации. Что скажете о markdown + mermaid для схем? Просто такое решение позволяет использовать методологию documentation as a code, которая показалась мне интересной

    • @dmitryanoshin8004
      @dmitryanoshin8004 Před 4 lety

      Звучит интересно, вы сделайте пример и я расшарю в слак и ещё можно на гитхаб загрузить информацию

    • @dmitryanoshin8004
      @dmitryanoshin8004 Před 4 lety

      Хорошая альтернатива! Но новичков может запутать еще больше. Можно будет добавить ссылку и пример в документацию на Git.

  • @alexandram1460
    @alexandram1460 Před 4 lety

    что значит подключаться напрямую к источнику? то есть, к примеру, я смотрю данные ГА через аккаунт, а не через BI систему, так?

    • @alexandram1460
      @alexandram1460 Před 4 lety

      тогда не вполне понятно как на каком этапе происходит, например, анимизация данных, если требуется? не в случае ГА, а, к примеру, CRM

    • @datalearn4398
      @datalearn4398  Před 4 lety

      Я имею ввиду, что без выгрузки данных из GA и загрузки их в хранилище.

    • @alexandram1460
      @alexandram1460 Před 4 lety

      @@datalearn4398 все) пазл сложился в голове! спасибо

  • @nikitabbrv5947
    @nikitabbrv5947 Před 4 lety

    По работе данные забираю из 1C УПП, настраиваю отчет и экспортирую его в xls, далее уже в power bi. думаю как правильно задачу программисту 1с поставить, чтобы автоматизировать это дело )

    • @datalearn4398
      @datalearn4398  Před 4 lety +1

      Нужно использовать ETL, ежедневно загружать данные в БД, которая служит хранилищем данных. Дальше можно создать дашборд в Power BI. 1с - это вроде SQL Server, ничего сложного.

    • @Pow3r0N
      @Pow3r0N Před 3 lety

      @@datalearn4398 работа с данными из 1С напрямую через SQL - нарушает политику лицензии 1С, кстати (но часто на это забивают =) )