Не смотря на ограниченные и не слишком удобные средства описания данных, R компенсируется наличием библиотечных средств, которые позволяют загружать в виде таблиц наборы данных, представленных в большинстве открытых форматах: таблицы в простом текстовом формате, таблицы Excel различных версий, данные в форматах CSV, XML и многих других.
В качестве платформы для языка R можно использовать основные операционные системы: Windows, Mac OS X, Linux и Classic
Курс предназначен для специалистов, которые занимается статистикой и анализом данных.
Получить базовые навыки работы с данными в Rstudio, научиться обрабатывать большие массивы данных, использовать библиотеки и строить графики
• аналитик данных
• социологи, экономисты и статисты, специалисты маркетинговой и финансовой аналитики
• специалисты, желающие работать с BigData, Data Science
• Знания в рамках курса Основы программирования на R или эквивалентная подготовка
• работать с текстовыми файлами и файлами в формате Excel;
• использовать таблицы баз данных;
• создавать динамические отчёты используя R Markdown;
• включать в отчёты таблицы и графики;
• работать с библиотекой ggplot2 и создавать различные варианты визуализации данных;
• создавать и настраивать уровни (Layers) в ggplot2;
• работать с интерактивной графикой;
• создавать Web Shiny приложения для интерактивной работы с данными через Веб;
• выполнять отладку Web Shiny приложений.
1. Введение
2. Обзор синтаксиса и основных объектов R
3. Функции семейства apply
4. Работа с пакетом dplyr
5. Работа с пакетом data.table
6. Описательные статистики
7. Анализ номинативных данных
8. Сравнение двух групп
9. Применение дисперсионного анализа
10. R MarkDown