Обработка больших данных при помощи Apache Spark ч2 | Технострим

Sdílet
Vložit
  • čas přidán 27. 08. 2024
  • Мероприятие: Moscow Data Science Junior Meetup, 10.06.2017
    Выступающий: Виталий Худобахшов, Одноклассники
    Apache Spark сегодня является одной из самых популярных технологий обработки больших данных в первую очередь за счет очень удобного API, который близок к обычному функциональному стилю программирования на Scala. Спикер расскажет, что такое Spark и как с ним работать. Рассмотрит некоторые паттерны использования Spark. И, конечно, расскажет, что такое большие данные с практической точки зрения. В качестве основных примеров разберет, как определить пол и возраст пользователя в социальной сети, если он указан с ошибкой. На этих примерах станет понятно, что можно узнать просто с помощью правильной обработки данных, даже не используя машинное обучение.
    Календарь событий: corp.mail.ru/r...
    О КАНАЛЕ:
    Официальный канал образовательных проектов Mail.Ru Group
    ► Нажмите здесь для подписки ‣ www.youtube.com...
    Актуальные лекции и мастер-классы о программировании от лучших IT-специалистов. Если вы увлечены мобильной и веб-разработкой, присоединяйтесь!
    Наши проекты:
    Технопарк при МГТУ им. Баумана ‣ park.mail.ru
    Техносфера при МГУ им. Ломоносова ‣ sphere.mail.ru
    Технотрек при МФТИ ‣ track.mail.ru
    Техноатом при МИФИ - atom.mail.ru
    Технополис при СПбПУ - polis.mail.ru
    ------------------------
    МЫ В СЕТИ:
    Технопарк в ВК | tpmailru
    Техносфера в ВК | tsmailru
    Технотрек в ВК | trackma...
    Техноатом в ВК | technoatom
    Технополис в ОК: ok.ru/tech...
    Технополис в ВК: technop...
    Блог на Хабре | habrahabr.ru/co...

Komentáře •