Недостаток времени обработчика импорта solr delta не определен

Я новичок в solr, и у меня есть довольно простой вопрос о дельта-импорте. У меня есть несколько новых записей в секунду в моей базе данных mySQL. Поэтому, когда я начинаю импорт во втором x, это очень возможно, что я получу несколько новых записей в БД в тот же самый момент после запуска импорта, но в следующий раз, когда я начну дельта-импорт, он проверит " last_index_time "в dataimport.properties и импортирует все записи, измененные после этого второго x. Поэтому я потеряю все записи, которые были изменены во втором x после начала последнего импорта. И если я прав, это будет одна и та же проблема, даже если можно скопировать временную метку с секунд на миллисекунды. Временная шкала будет меньше, количество потерянных записей будет меньше, но сама проблема все равно будет там.

Я не нашел упоминания об этой проблеме в учебниках или где-либо еще в этом отношении. Я первый, кто имеет дело с несколькими отчетами в секунду, или я пропустил что-то еще?

Спасибо заранее!

1 ответ

Если нужно обработать точную секунду, вы просто проверяете записи, равные или превышающие последнее измененное время. В любом случае, если запись уже существует (идентифицирована уникальным ключом), она будет перезаписана. Solr обновит запись по умолчанию, поэтому дубликаты не будут созданы.

licensed under cc by-sa 3.0 with attribution.