Независимо от того, являетесь ли вы молодым специалистом или опытным исследователем, мы поможем подобрать версию Stata, соответствующую вашим требованиям:
- Stata/MP: самая быстрая версия Stata (для четырехъядерных, двухъядерных и многоядерных / многопроцессорных компьютеров), способная анализировать самые большие базы данных.
- Stata/SE: Standard Edition. Версия Stata для больших наборов данных.
- Stata/BE: Basic Edition. Версия Stata для наборов данных среднего размера.
Stata / MP - самая быстрая и самая большая версия Stata. Практически любой современный компьютер может использовать преимущества многопроцессорного анализа в версии Stata / MP. С нашим программным обеспечением успешно показывают эффективность такие процессоры как Intel i3, i5, i7, i9, Xeon, Celeron и AMD. На двухъядерных чипах Stata / MP работает на 40% быстрее в целом и на 72% быстрее там, где это необходимо, при выполнении команд, требующих больших затрат времени. С более чем двумя ядрами или процессорами Stata / MP работает еще быстрее.
Stata/MP, Stata/SE и Stata/BE работают на любом компьютере, но Stata/MP работает быстрее. Вы можете приобрести лицензию Stata/MP на определенное количество ядер на вашем компьютере (максимольное количество ядер - 64). Например, если на вашей машине восемь ядер, вы можете приобрести лицензию Stata/MP на восемь, четыре или два ядра.
Отличительные технические особенности продуктов Stata представлены в сравнительной таблице ниже. Все вышеперечисленные выпуски имеют одинаковый полный набор функций и включают обработку документации в формате PDF.
Сравнительная таблица версий продуктов Stata
Возможности продуктов |
Stata/BE |
Stata/SE |
Stata/MP |
||
2-core | 4-core | 6+ | |||
Максимальное число переменных | До 2 048 | До 32 767 | До 120 000 | ||
Максимальное количество наблюдений | До 2.14 миллиардов | До 20 миллиардов | |||
Выполняет большинство команд | Быстро | Быстрее в 2 раза | Быстрее в 4 раза | Быстрее в 4> раз | |
Время запуска логистической регрессии с 10 миллионами наблюдений и 20 ковариатами | 20 сек | 10 сек | 5.2 сек | < 5.2 сек | |
Максимальное число независимых переменных | 798 | 10998 | 65532 | ||
Полный набор статистических функций | + | + | + | + | + |
Повышенное качество графических представлений | + | + | + | + | + |
Обширные возможности управления данными | + | + | + | + | + |
Реальная точность проводимых исследований | + | + | + | + | + |
Комплексная отчетность | + | + | + | + | + |
Мощный язык программирования | + | + | + | + | + |
Полная поддержка PDF-документации | + | + | + | + | + |
Техническая поддержка высокого класса | + | + | + | + | + |
Возможность обновления ПО | + | + | + | + | + |
Windows, macOS and Linux | + | + | + | + | + |
И многое другое для всех ваших потребностей в науке о данных | + | + | + | + | + |
Требования по оперативной памяти | 1 GB | 2 GB | 4 GB | ||
Требования к свободной памяти на жестком диске | 2 GB | 2 GB | 2 GB |
Новое в версии Stata 19
Машинное обучение с использованием машинного обучения H2O
Можно применять машинное обучение для извлечения инсайтов из данных, когда традиционные статистические модели оказываются недостаточными. Например, доступны градиентный бустинг (GBM) и случайный лес — для решения задач регрессии или классификации. Можно также настраивать гиперпараметры, использовать валидацию или перекрестную проверку (CV), оценивать производительность модели, объясняйте прогнозы и многое другое.
Анализ CATE
Помимо традиционного анализа общего эффекта, современные аналитические методики позволяют изучать вариативность влияния различных факторов на отдельных индивидов и группы. Это позволяет выявить уникальные особенности каждого случая и сравнивать эффективность альтернативных вмешательств и стратегий управления.
HDFE: Линейные модели с множеством фиксированных эффектов
Иногда исследование требует учета множества категоричных признаков, каждый из которых имеет большое количество значений. Методика HDFE позволяет включать такие признаки непосредственно в линейные модели, значительно расширяя возможности анализа многомерных данных.
Байесовский выбор переменных
Для повышения точности результатов в моделях линейной регрессии рекомендуется применять байесовский подход к выбору значимых переменных. Использование специальных распределений, таких как spike-and-slab или глобальное/локальное сжатие, обеспечивает гибкость и возможность учитывать неопределенности.
Интервальная цензурированная модель Кокса
В ситуациях, когда точные временные отметки события известны лишь приблизительно, полезно применить интервальную цензуру. Этот метод подходит для изучения сложных процессов, таких как развитие диабета или гипертонии, позволяя анализировать наступление нескольких связанных событий.
Байесовская квантильная регрессия
Квантильная регрессия полезна, когда важно оценить распределение зависимой переменной на всей шкале вероятностей. Применив байесовский подход, можно получить полную картину распределения всех интересующих показателей вместе с достоверными стандартными ошибками.
Панельная векторная авторегрессия (VAR)
Панельные VAR-модели незаменимы для исследования взаимозависимости переменных, измеряемых в течение длительного периода и по разным единицам наблюдения. Они позволяют обнаружить влияние одного показателя на другой с течением времени.
CRE-модель (Коррелированные случайные эффекты)
Модели с коррелированными случайными эффектами позволяют учесть постоянство характеристик объектов, наблюдаемых в панельных данных, и одновременно контролировать связь между этими характеристиками и индивидуальными эффектами.
Байесовская бутстреп оценка
Этот метод помогает повысить точность оценивания параметров на небольших выборках путем включения дополнительной априорной информации. Подходит как для стандартных процедур, так и для специально разработанных функций.
Контроль-функции в линейных и пробит-моделях
Применение контрольных функций упрощает работу с эндогенными переменными различного типа (непрерывные, бинарные, порядковые). Благодаря этому решению легко проверить наличие эндогенности и построить надежные модели.
Новая графика: Тепловые карты, графики с ДИ и др.
Тепловые карты, диаграммы с доверительными интервалами и другие типы графиков помогают быстро интерпретировать результаты исследований, делая выводы доступнее и понятнее широкой аудитории.
Инструменты для SVAR-моделей
Использование инструментов вместо жестких временных ограничений улучшает качество анализа динамических причинно-следственных связей, помогая глубже разобраться в структуре исследуемых явлений.
IV-LPIRF: Локальные проекции с инструментом
Метод локальных проекций теперь поддерживает учет эндогенности, повышая надежность выводов относительно последствий конкретных воздействий.