ШКОЛА ПРИКЛАДНОГО АНАЛИЗА ДАННЫХ
Программа школы
10 декабря
08.30 – 09.00
08.30 – 09.00
Регистрация
09.00 – 10.00
09.00 – 10.00
Торжественное открытие Школы
Презентация проектов университетов участников Консорциума
Михаил Мягков, председатель совета Консорциума, научный руководитель лаборатории наук о больших данных и проблемах общества ТГУ
Вячеслав Гойко, заведующий лабораторией наук о больших данных и проблемах общества ТГУ
10.00 – 11.00
10.00 – 11.00
Модель университетского центра прикладного анализа данных
Виталий Кашпур, заведующий кафедрой социологии ТГУ
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
11.00 – 12.00
11.00 – 12.00
Источники открытых данных
Вячеслав Гойко, заведующий лабораторией наук о больших данных и проблемах общества ТГУ
На лекции будут представлены источники открытых данных под различные задачи и отрасли, а также критерии их выбора и способы добычи.
12:00 – 13:00
12:00 – 13:00
Создание поисковых объектов в системе "Крибрум" на основе лингвистических маркеров
Евгений Петров, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ
Участники познакомятся с возможностями поисковой системы. Определят поисковые объекты под свои задачи. Для каждого поискового объекта сформируют лингвистические маркеры с учетом различных логических операций.
13.00 – 14.00
13.00 – 14.00
Обед
14.00 – 15.00
14.00 – 15.00
Технологии сбора данных открытых платформ
Роман Палкин, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ
В рамках мастер-класса слушатели познакомятся с различными способами сбора открытых данных: методами работы с API (программный интерфейс приложения), парсингом открытых данных сайтов и порталов.
15.00 – 16.00
15.00 – 16.00
Обзор платформы по сбору и анализа данных социальных сетей
Роман Палкин, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ
В рамках мастер-класса участники познакомятся с возможностями платформы по сбору и анализу данных социальных сетей на примере выгрузки подписчиков сообщества, друзей и пабликов у пользователей.
16.00 – 17.00
16.00 – 17.00
Групповая проектная работа: формирование команд, выбор тематики проекта.
Модератор: Виталий Кашпур, заведующий кафедрой социологии ТГУ
17.00 – 18.00
17.00 – 18.00
Визионерская лекция "Big Data: перспективы, границы и возможности метода"
11 декабря
08.30 – 09.00
08.30 – 09.00
Утренний кофе
09.00 – 10.00
09.00 – 10.00
Текстовая аналитика на платформе Polyanalyst
Евгений Петров, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ.
Давид Сазонов, руководитель направления компании «Megaputer Intelligence».
Слушатели познакомятся с возможностями лингвистического анализа текстов с использованием платформы Polyanalyst: классификация текстов, выделение ключевых лиц и событий, контент-анализ, определение содержания и тональности текстов.
10.00 – 12.00
10.00 – 12.00
Информационное освещение деятельности организации
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
Давид Сазонов, руководитель направления компании «Megaputer Intelligence».
В рамках мастер-класса участникам предстоит произвести очистку результатов поисковой выдачи системы Крибрум, проанализировать её с помощью инструментов текстового анализа. Выявление ключевых инфоповодов, определение основных информационных площадок. Анализ структуры инфополя: оценка его по эмотивным характеристикам - тональности, динамике упоминаний и типам площадок.
12.00 – 13.00
12.00 – 13.00
Анализ текстового содержания учебных программ
Евгений Петров, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ
Давид Сазонов, руководитель направления компании «Megaputer Intelligence».
Структуризация и выделение описания компетенций из текстового содержания учебных программ образовательных курсов. Построение и визуализация компетентностных связей между различными образовательными программами.
13.00 – 14.00
13.00 – 14.00
Обед
14.00 – 15.00
14.00 – 15.00
Прогнозирование политических предпочтений пользователей социальных сетей.
Иван Козицин, ассистент кафедры высшей математики, аспирант Московского физико-технического института
Слушатели познакомятся с возможностями алгоритмов машинного обучения для прогнозирование политических предпочтений и предсказания результатов выборов на основе открытых данных пользователей социальных сетей.
15.00 – 16.00
15.00 – 16.00
Инфраструктура данных. Основные форматы, методы и технологии сбора и хранения данных
Вячеслав Гойко, заведующий лабораторией наук о больших данных и проблемах общества ТГУ
Технологии сбора и хранения больших массивов неструктурированных данных. Организация высокоскоростного доступа к базам данных. Требования к вычислительной инфраструктуре.
16.00 – 17.00
16.00 – 17.00
Групповая проектная работа: описание планируемого результата проекта, подбор необходимых данных
Модератор: Виталий Кашпур, заведующий кафедрой социологии ТГУ
17.00 – 18.00
17.00 – 18.00
Визионерская лекция "Управление на основе данных в коммерческом секторе".
Спикер уточняется
12 декабря
08.30 – 09.00
08.30 – 09.00
Утренний кофе
09.00 – 10.00
09.00 – 10.00
Введение в Social Network Analysis
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
Слушатели познакомятся с возможностями методологии сетевого анализа взаимодействия между различными объектами (семантическими, социальными и прочими). Сетевой подход позволяет увидеть и проанализировать, каким образом связаны акторы, включая динамику и пространство.
10.00 – 11.00
10.00 – 11.00
Social Network Analysis: сетевое взаимодействие между субъектами в социальных сетях
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
Участникам предстоит проанализировать взаимодействие пользователей социальных сетей под различные задачи. Результатом анализа станет сетевая карта, реконструирующая не только главных агентов, но и силу, особенности и модель взаимодействия.
11.00 – 13.00
11.00 – 13.00
Моделирование распространения событий. Идентификация вбросов
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
Анализ аудитории и процессов распространения инфоповодов информационных онлайн площадок. Определение скорости и направления распространения инфоповодов, оценка охвата аудитории. Картирование схемы распространения события: выявление направления потока, ключевых узлов, особенности восприятия информации различными социальными группами.
13.00 – 14.00
13.00 – 14.00
Обед
14.00 – 15.00
14.00 – 15.00
Социальный портрет выпускника университета на основе анализа открытых данных
Юлия Мундриевская, ведущий аналитик лаборатории наук о больших данных и проблемах общества
Евгений Петров, технический специалист лаборатории наук о больших данных и проблемах общества ТГУ
В рамках мастер-класса слушатели познакомятся с технологией социального портретирования пользователей социальных сетей на основе анализа их открытых данных: подписки, сообщества, активность, содержание стен, друзья.
15.00 – 16.00
15.00 – 16.00
Групповая проектная работа: описание планируемого результата проекта, подбор необходимых данных.
Модератор: Виталий Кашпур, заведующий кафедрой социологии ТГУ
16.00 – 18.00
16.00 – 18.00
Визионерская лекция "Бизнес-модель цифрового университета"
Спикер уточняется
13 декабря
08.30 – 09.00
08.30 – 09.00
Утренний кофе
09.00 – 11.00
09.00 – 11.00
Большие данные и машинное обучение в прогнозировании когнитивных особенностей личности. Анализ данных об успеваемости
Артем Фещенко, заведующий учебно-научной лабораторией компьютерных средств обучения ИДО ТГУ
Мастер-класс позволит получить представления о возможностях прикладного применения исследований когнитивных особенностей учащихся с использованием технологий анализа больших пользовательских данных из социальных сетей. Предлагаемый подход позволяет получать дополнительные данные об учащихся, повышать сложность цифровой модели учащегося для прогнозной аналитики и персонализации обучения.
11.00 – 12.00
11.00 – 12.00
Идентификация радикальных онлайн сообществ на основе анализа изображений
Вячеслав Гойко, заведующий лабораторией наук о больших данных и проблемах общества ТГУ
Анализ изображений в контенте онлайн сообществ социальной сети с идентификацией паттернов, в том числе запрещенной законом символики, указывающих на наличие радикальных идей и призывы к насилию.
12.00 – 13.00
12.00 – 13.00
Мониторинг инсайда торговой площадки
Вячеслав Гойко, заведующий лабораторией наук о больших данных и проблемах общества ТГУ
Сергей Котик, директор по развитию компании «GoodsForecast»
Оценка связанности субъектов социальных сетей, инструментов финансового рынка и тематик новостного потока. Выделение лидеров мнений, ключевых информационных групп и идентификация профилей открытых инсайдеров.
13.00 – 14.00
13.00 – 14.00
Обед
14.00 – 16.00
14.00 – 16.00
Групповая проектная работа: Финальная сборка проектов команд. Подготовка презентаций команд.
Модератор: Виталий Кашпур, заведующий кафедрой социологии ТГУ
17.00 – 18.00
17.00 – 18.00
Защита проектов команд перед экспертным советом
Михаил Мягков, председатель совета Консорциума, научный руководитель лаборатории наук о больших данных и проблемах общества ТГУ