Анализ данных свободной сортировки в R

В психологии для исследования когнитивного стиля диапазон эквивалентности применяются различные модификации методики «Свободная сортировка объектов» (Free Sorting Test) Гарднера. В методике обычно используется от 30 до 70 стимулов (понятий). В этой заметке я продемонстрирую некоторые возможности обработки результатов проведения методики «Свободная сортировка объектов» в R.

Стемминг текстов на естественном языке

В прошлый раз я рассказывал про такие элементы препроцессинга текстовых данных, как приведение к одному регистру, удаление стоп-слов и пунктуации. Второй этап препроцессинга подобных данных, необходимый в некоторых задачах — это стеммизация, приведение слов к своей основной форме. Например, «работодателя» – «работодатель».

Существует несколько…

Препроцессинг текстов на естественном языке

При работе с текстами, написанными на естественном языке, один из основных этапов — подготовка данных к анализу. В частности, уделение стоп-слов, приведение слов к одному регистру и так далее. Для таких задач я использую функции пакетов stringr и tm.

Один из первых шагов — это приведение текстов к одному регистру с помощью функции tolower():

Профилирование кода в R

Функции system.time(), benchmark(), microbenchmark() позволяют оценить общее время выполнения выражения и нивелировать возможные вариации за счет множества попыток, однако для более полной оценки и определения стратегии оптимизации кода необходимо также выявлять и «узкие» места в выполняемом коде. К подобным «узким» местам можно отнести те вызовы, которые занимают…

Добавление аннотаций на графики ggplot

Иногда требуется добавить на график какую-нибудь текстовую аннотацию - пояснение или же значение конкретной точки. С определенной легкостью это можно для графиков, построенных с помощью функции annotate() пакета ggplot2. Приведу пример аннотаций на гистограмме частот значений скошенного t-распределения (которое можно использовать для моделирования времени реакции в психологических…