Как применить методы классификации машинного обучения к данным 1D временных рядов

У меня есть данные ИДУ (акселерометр, магнитометр и гироскоп) во время разнообразных упражнений (приседания, отжимания, приседания, борозды). Эти упражнения завершаются одним сигналом 1D временных рядов, и я хотел бы использовать метод классификации машинного обучения для определения различных упражнений в сигнале. Я не хочу конденсировать сигнал в пики 0D и строить свои функции таким образом, а сохранить целостность временной области. Ниже приведена цифра, показывающая пример данных с акселерометра, который содержит четыре упражнения. Поэтому мой вопрос заключается в том, какой метод будет наиболее эффективен при этом? K-означает, что кластеризация была бы идеальной в смысле 0D, так есть ли 1D-эквивалент? Любые ресурсы для python (sklearn) будут очень благодарны!

Заранее спасибо!

2 ответа

Я думаю, что вместо классификации вы хотите сделать кластеризацию. Классификация помещает данные в предопределенные категории (обычно на основе некоторых данных обучения), тогда как кластеризация используется для группировки частей данных в ранее неизвестные классы. Вот краткая таблица, показывающая разницу между классификацией и кластеризацией.

Одна вещь, которую вы можете сделать, - нарезать временные ряды на перекрывающиеся образцы (возможно, 1000 временных интервалов каждый) и рассчитать некоторые статистические данные для них (среднее значение, дисперсия и т.д.). Затем выполните K-Means Clustering по статистике, которую вы подсчитали.

После выполнения кластеризации вы можете использовать классы, определенные во время кластеризации, для создания данных обучения для классификатора.


Для данных временных рядов стандартным методом является мешок-кадры, измельчающие его на мелкие куски, называемые рамами. Кадры могут быть перекрыты и окончены или не пересекаются. Размер кадра является важным гиперпараметром и зависит от задачи. На каждом кадре рассчитываются такие функции, как min, max, median, variance, RMS. Чтобы использовать изменения в течение времени в классификаторе, вы используете функции с задержкой или дельта. Отложенные функции - это значения из предыдущих кадров. Функции Delta вычисляются как разница текущего кадра с предыдущим.

Для классификации вам нужно будет обозначить сегменты различных видов деятельности. Обратите внимание, что для обнаружения активности человека на данных ускорителя имеется также множество доступных общедоступных наборов данных, таких как UCI: распознавание человеческой деятельности с использованием смартфонов

licensed under cc by-sa 3.0 with attribution.