Статистический анализ данных в социологии
Программа пятидневного курса
Первый день
Пакет программ IBM SPSS Statistics. Информация, обрабатываемая статистическим пакетом (2 часа):
- Подготовка данных
- Окна: редактор данных, навигатор вывода, меню, диалоговые окна
- Формирование файла данных: редактор данных
- Работа с результатами
- Мобильные таблицы
Введение в статистический анализ социальной информации (2 часа):
- Оценка результатов социологических исследований по выборкам
- Принципы формирования выборок
- Влияние объема выборки
- Понятие нормального распределения
- Независимые и зависимые переменные
Преобразование данных социологического исследования (4 часа):
- Вычисление переменных
- Перекодирование значений в переменных
- Автоматическая перекодировка
- Подсчет встречаемости значений в переменных
- Ранжирование наблюдений
- Визуальная и категориальная оптимизация количественных переменных
- Формирование свойств переменных
Второй день
Подытоживание (обобщение) отдельных переменных (4 часа):
- Шкалы измерения
- Подытоживание номинальных переменных
- Подытоживание порядковых переменных
- Подытоживание количественных переменных
Изучение связи между категориальными переменными в социологических исследованиях (4 часа):
- Простая таблица сопряженности
- Проценты в ячейках таблицы сопряженности
- Дополнительные возможности процедуры «Таблицы сопряженности»
- Количественные переменные
- Таблицы сопряженности и выборочные данные
- Статистические коэффициенты (меры связи)
Самостоятельная работа 1 (до 21 часа)
Третий день
Проверка гипотезы об одном среднем значении (2 часа):
- Расчет Т-статистик
- Понятие «доверительный интервал»
- Доверительный интервал для разности средних
- Нулевая и альтернативные гипотезы
Проверка гипотезы о двух связанных средних (2 часа):
- Преимущество парного плана
- Анализ различий
- Т-критерий для парных выборок
- Проверка нулевой гипотезы
- Исследование нормальности
Проверка гипотезы о двух независимых средних значениях (4 часа):
- Т-критерий для независимых выборок
- Распределение разностей
- Стандартная ошибка разности средних
- Проверка равенства дисперсий
- Интерпретация наблюденного уровня значимости
Самостоятельная работа 2 (до 21 часа)
Четвертый день
Однофакторный дисперсионный анализ (4 часа):
- Условия применения
- Проверка нулевой гипотезы
- Таблица дисперсионного анализа
- Разброс внутри и между группами
- Процедура множественного сравнения
- Апостериорные критерии
Двухфакторный дисперсионный анализ (2 часа):
- Условия применения
- Взаимодействие между факторами
- Проверка главных эффектов
- Апостериорные сравнения в общей линейной модели
- Графики профилей в общей линейной модели
Анализ статистических взаимосвязей для количественных и порядковых переменных. Корреляции (2 часа):
- Особенности применения
- Корреляция и детерминация
- Коэффициент корреляции Пирсона
- Ранговые коэффициенты корреляции Спирмана и Кендала
Итоговая работа (до 21 часа)
Пятый день
Анализ пригодности (2 часа):
- Альфа Кронбаха
- Расщепление на две половины
- Определение нижней границы пригодности Гуттмана
- Оценка максимального правдоподобия пригодности
- Внутриклассовый коэффициент корреляции
Регрессионный анализ (2 часа):
- Простая линейная регрессия
- Множественная линейная регрессия
- Нелинейная регрессия
- Бинарная логистическая регрессия
- Множественная логистическая регрессия
Факторный анализ (2 часа)
- Цели проведения типологического анализа.
- Основание типологии.
- Выбор совокупностей признаков и объектов факторного анализа.
- Получение исходных факторных структур.
- Проблема определения числа факторов.
- Вращение матрицы факторных нагрузок.
- Факторный анализ как метод понижения размерности пространства признаков.
- Проблема интерпретации результатов факторного анализа
Процедура кластерного анализа (2 часа)
- Основная идея метода кластерного анализа.
- Понятия «формы кластера» и функции расстояния.
- Иерархические кластерные методы.
- Кластерный анализ объектов и переменных.
- Кластерный анализ методом к-средних.
- Установка количества выделяемых кластеров.
- Установка начальных центров кластеров.
- Интерпретация результатов кластерного анализа.
Презентация итоговых работ (2часа):
- Выступление до 10 минут + вопросы и обсуждение до 5 минут.
Подведение итогов и вручение сертификатов