Этот блог посвящен hadoop'у - свободной системе распределенных вычислений; "экосистеме", как ее называют создатели.
Решения, типа hadoop'а нужны, когда
- у вас есть кластер, но вы не знаете, что с ним делать :)
- вам надо хранить несколько десятков-сотен терабайт данных в одном месте
- при этом легко обращаться к ним, не вытаскивая харды с бекапом из пыльных коробок
- или даже вообще: читать и писать данные в онлайне
- обрабатывать данные на своем кластере за разумное время. Например сортировать, ранжировать, считать статистики, да вообще, делать что потребуется.
- тратить на разработку не месяцы и годы, а дни и недели
Цель этого блога - рассказать о такой клевой штуке как hadoop, описать полезные программы, которые входят в него, ну и держать народ в курсе событий в мире hadoop разработки.
добра,
ОтветитьУдалитьесть ли что-нибудь для совсем чайников?
Мне очень интересно понять как это работает. Обычно я читаю на английском, но по хадупу очень сложно(хотя я гуглил всего час) найти что-то для чайников вообще не знакомых с этой системой. Мб я могу задать пару вопросов сюда?
Пара основных книг про хадуп уже переведена на русский:
Удалитьhttp://www.ozon.ru/context/detail/id/21207254/
http://www.ozon.ru/context/detail/id/7631420/
Еще про хадуп вышли книги из серии "для чайников":
http://goo.gl/wbgxhp
http://goo.gl/4BSni8