Использование solr для индексирования различных типов данных


7 принят

Оба являются законными подходами, но есть компромиссы. Во-первых, насколько большой ваш набор данных? Если он достаточно велик, и вы можете разбить его на несколько серверов, вероятно, имеет смысл иметь разные индексы.

Во-вторых, насколько важна производительность - индексирование всего этого, вероятно, приведет к худшей производительности, но степень зависит от того, сколько данных есть и насколько сложны запросы.

В-третьих, вам нужно запрашивать несколько типов данных в одном и том же поиске? Если это так, индексирование всего вместе может быть удобным способом этого. Технически это может быть достигнуто с помощью отдельных индексов, но получение наиболее релевантных результатов для запроса может быть проблемой (а не тем, что это еще не так)

В-четвертых, один индекс с единой схемой и конфигурацией может упростить жизнь того, кто будет развертывать и поддерживать систему.

Еще одна вещь, которую следует учитывать, это идентификаторы - все ли разные объекты имеют уникальный идентификатор для всех типов? Если нет, вам, вероятно, понадобится создать это, если вы хотите проиндексировать их вместе.

индексация, Lucene, Solr,

indexing,lucene,solr,

1

Ответов: 1


7 принят

Оба являются законными подходами, но есть компромиссы. Во-первых, насколько большой ваш набор данных? Если он достаточно велик, и вы можете разбить его на несколько серверов, вероятно, имеет смысл иметь разные индексы.

Во-вторых, насколько важна производительность - индексирование всего этого, вероятно, приведет к худшей производительности, но степень зависит от того, сколько данных есть и насколько сложны запросы.

В-третьих, вам нужно запрашивать несколько типов данных в одном и том же поиске? Если это так, индексирование всего вместе может быть удобным способом этого. Технически это может быть достигнуто с помощью отдельных индексов, но получение наиболее релевантных результатов для запроса может быть проблемой (а не тем, что это еще не так)

В-четвертых, один индекс с единой схемой и конфигурацией может упростить жизнь того, кто будет развертывать и поддерживать систему.

Еще одна вещь, которую следует учитывать, это идентификаторы - все ли разные объекты имеют уникальный идентификатор для всех типов? Если нет, вам, вероятно, понадобится создать это, если вы хотите проиндексировать их вместе.

индексация, Lucene, Solr,
Похожие вопросы
Яндекс.Метрика