350 ГБ (растет на пару ГБ в неделю) ... Все эти данные должны быть доступны для аналитики
У вас есть гуру MySQL в доме? Если да, конечно => просто создайте и увеличьте этот MySQL кластер. Единственная проблема, связанная с этим решением, заключается не в том, что это MySQL, и не в том, что это не NoSQL =>, а в буквальном смысле, потому что для его настройки требуется эксперт, и он всегда будет рядом с вами в случае необходимости. изменилось. Но угадайте, что => SQL НАМНОГО лучше и проще для аналитики, чем симуляция SQL с отображением / сокращением.
Что-то, что может стать проблемой позже с решением MySQL, является Oracle . Поэтому убедитесь, что вы понимаете, какие функции MySQL вы можете использовать бесплатно, и за какие функции вам придется платить.
Если вы не имеете эксперта MySQL в доме, или вы не хотели бы , чтобы заплатить за один, вы определенно можете обратиться к NoSQL. Это не означает, что вам не понадобится опыт работы с продуктом NoSQL, но настройка и запуск узлов X как единой системы - чрезвычайно простой и естественный процесс для решений NoSQL.
Например, в Riak и нескольких других животных NoSQL большинство сложностей с дистрибутивом решаются с помощью продукта без необходимости что-либо делать вообще => это действительно так просто.
Цена, которую вы платите с NoSQL, - это потеря SQL (если подумать о хороших функциях агрегирования) и согласованности, что в конечном итоге является возможным , и если вы строго занимаетесь аналитикой, для вас согласованность может вообще не быть ценой.
Взамен вы получаете очень естественную обработку больших данных, отказоустойчивость и многое другое .
Если вы находитесь в пространстве Hadooooxyz, и у вас все в порядке, посмотрите на Hadapt , который обещает 5-кратную производительность Hive.