Метаданные страницы в keen.io

У меня есть вопрос о лучших методах добавления метаданных к нашим событиям просмотра keen.io. Внутри мы используем 3 разные категории ключевых слов для идентификации части контента, и эти ключевые слова живут в тегах на каждой странице. Хорошим примером может быть следующее:

Мы хотим иметь возможность сегментировать наших пользователей на основе этих уровней и делать такие запросы:

  • Просмотреть весь трафик, сегментированный ключевыми словами tier1
  • См. Наиболее популярные ключевые слова tier2, которые относятся к определенному ключевому слову tier1
  • ... и так далее.

Здесь мой вопрос: похоже, мы могли бы просто отправить эти метаданные вместе со случаем просмотра страницы, но в итоге у нас будет много избыточных данных, которые могут жить в отдельном месте. Например, если мы очищаем ключевые слова каждый день для наших страниц, мы можем индексировать их по URL-адресу и не иметь всех дублирующих метаданных в keen.io.

Как бы вы к этому подошли? Я застрял на землях SQL, и должен ли я просто не беспокоиться о дублированных данных?

Связанный с нами вопрос заключается в том, что наши ключевые слова являются в основном списками, а документация keen.io говорит, что нам следует избегать списков. Нужно ли мне создавать событие Metadata для каждого слова? Кажется, что это слишком много, чтобы отправлять +10 запросы на каждое просмотрение страницы.

1 ответ

Короткий ответ - не беспокойтесь о дублировании. Когда дело доходит до данных событий, денормализация - ваш друг. Интенсивный интерфейс запросов разработан, чтобы быть самым мощным, когда каждое событие содержит много свойств - фактически состояние мира в то время.

Мишель написала руководство для размышления о данных событий, которые контрастируют с реляционными данными. Многие из нас (включая меня) застряли на земле SQL раньше и нашли это руководство полезным:

Что касается списков - это в основном списки объектов, которые вы хотите избежать. В этом случае ваш список является одним из строк, поэтому вы все равно можете сделать довольно много запросов к этому свойству.

Для получения дополнительной информации о Keen & lists of objects ознакомьтесь с этим вопросом SO: Вложенные объекты JSON In Keen IO.

licensed under cc by-sa 3.0 with attribution.