Этот блог посвящен hadoop'у - свободной системе распределенных вычислений; "экосистеме", как ее называют создатели.
Решения, типа hadoop'а нужны, когда
- у вас есть кластер, но вы не знаете, что с ним делать :)
- вам надо хранить несколько десятков-сотен терабайт данных в одном месте
- при этом легко обращаться к ним, не вытаскивая харды с бекапом из пыльных коробок
- или даже вообще: читать и писать данные в онлайне
- обрабатывать данные на своем кластере за разумное время. Например сортировать, ранжировать, считать статистики, да вообще, делать что потребуется.
- тратить на разработку не месяцы и годы, а дни и недели
Цель этого блога - рассказать о такой клевой штуке как hadoop, описать полезные программы, которые входят в него, ну и держать народ в курсе событий в мире hadoop разработки.