tag:blogger.com,1999:blog-7112647817263902074.post3823336180844844893..comments2024-03-21T10:53:32.840+03:00Comments on Блог о Hadoop: Как использовать hive в веб аналитике. Статистика по пользователямmezentsevhttp://www.blogger.com/profile/11161061691868200384noreply@blogger.comBlogger3125tag:blogger.com,1999:blog-7112647817263902074.post-9088665082589662792012-06-27T16:16:30.808+04:002012-06-27T16:16:30.808+04:00Честно говоря, пока не измерял:) На данный момент ...Честно говоря, пока не измерял:) На данный момент время, затраченное на подготовку данных, не столько критично на нашем проекте. Более критично время выполнения запросов на подготовленных таблицах. Знаю только, что в Hive имеются лимиты (можно настраривать) на количество динамически сгенерированных партиций.Anonymoushttps://www.blogger.com/profile/02982203031447458861noreply@blogger.comtag:blogger.com,1999:blog-7112647817263902074.post-57240322500204857802012-06-27T15:28:22.526+04:002012-06-27T15:28:22.526+04:00Так конечно удобнее, но насколько серьезный оверхе...Так конечно удобнее, но насколько серьезный оверхед это несет?mezentsevhttps://www.blogger.com/profile/11161061691868200384noreply@blogger.comtag:blogger.com,1999:blog-7112647817263902074.post-2954585450108857412012-06-27T04:48:07.393+04:002012-06-27T04:48:07.393+04:00Комментарий к строчке:
INSERT OVERWRITE TABLE sess...Комментарий к строчке:<br />INSERT OVERWRITE TABLE sessions PARTITION (day='2012-05-01')<br />На практике мы можем использовать Dynamic Partitions<br />https://cwiki.apache.org/confluence/display/Hive/Tutorial#Tutorial-DynamicpartitionInsert<br />В этом случае значение partition колонки будет браться из запроса и его не придется указывать вручную.Anonymoushttps://www.blogger.com/profile/02982203031447458861noreply@blogger.com