Not even one
Jun. 20th, 2017 03:43 pmNo righteous...Not even one.
https://techcrunch.com/2017/06/19/deep-root-gop-data-leak-upguard/
Терабайт персональных данных избирателей в США валялся в онлайне в почти открытом доступе. Говорят, что ответственная за енто дело конторка – занималась анализом бигдаты по избирателям в интересах республиканской партии США. Не пойму (терабайт данных – это не так и много):
a) Каким боком терабайт – это бигдата
б) нафик их в амазон/public cloud грузить в открытый доступ.
https://techcrunch.com/2017/06/19/deep-root-gop-data-leak-upguard/
Терабайт персональных данных избирателей в США валялся в онлайне в почти открытом доступе. Говорят, что ответственная за енто дело конторка – занималась анализом бигдаты по избирателям в интересах республиканской партии США. Не пойму (терабайт данных – это не так и много):
a) Каким боком терабайт – это бигдата
б) нафик их в амазон/public cloud грузить в открытый доступ.
Легко
Date: 2017-06-20 02:12 pm (UTC)Другое дело что обычно такого рода анализ делается на обезличенных данных, как раз по этой причине.
Ну а Амазон тут не при чём, облажаться с правами доступа везде можно.
Re: Легко
Date: 2017-06-20 02:16 pm (UTC)Терабайт данных, по моему старообрядческому мнению – держать нужно приватно, и потом – какая нафик бигдата, если искомая дата влазит в оперативную память 1 шт свободно покупаемых стерверов-писюков?
Re: Легко
Date: 2017-06-20 02:26 pm (UTC)Входными данными может быть, например, граф социальных сетей или кредитная история, причём эти данные вообще могут быть в другом месте, и даже не в одном месте.
Re: Легко
Date: 2017-06-20 02:30 pm (UTC)Все (кроме может быть раздутой инфы про связность в соцсетях) – вроде по преженему помещается в 40-60кб/1ТБ, though.
Re: Легко
Date: 2017-06-20 03:50 pm (UTC)Re: Легко
Date: 2017-06-20 03:54 pm (UTC)Re: Легко
Date: 2017-06-20 03:58 pm (UTC)Re: Легко
Date: 2017-06-20 04:27 pm (UTC)Re: Легко
Date: 2017-06-20 07:30 pm (UTC)Re: Легко
Date: 2017-06-20 08:00 pm (UTC)Never mind, я, наверное, старомоден слишком. Я где-то считаю, что если данные можно обрабатывать локально – их вполне можно обрабатывать локально, и это даж всяко предпочтительнее.
Хех, wild guesses.
Re: Легко
Date: 2017-06-21 02:05 am (UTC)Re: Легко
Date: 2017-06-21 06:17 pm (UTC)Хех, знать бы что они там считали...
Re: Легко
Date: 2017-06-22 01:37 am (UTC)Своим есть смысл заморачиваться, когда четырех горшков мало, но там же такой секс начинается, что никакого гамака уже не надо и устаревает оно со скоростью паровоза.
Сценариев, когда аренда не годится на самом деле не так много и основной - это много лет гонять одно и то же. Но в нем проблема в том, что обычно народ промахивается с определением и через два года обнаруживает, что у них в полтора раза больше данных, чем ожидалось и оно ни в память не лезет, ни диск за этим не успевает, а на новый денег дадут не раньше, чем через еще два года.
Re: Легко
Date: 2017-06-22 04:41 am (UTC)Amazon X1 с 2TB рама (так чтобы in-memory процесить 1TB данных и считать что угодно не сильно заморачивась, на таких тестят/используют как раз big-time BI) стоит $14 per hour. Сдается мне, что пару месяцев эксплуатации этого чуда – я куплю себе физический сервер c похожими характеристиками (which I will get to keep). Так же мне сдается, что проштрафившиеся герои статейки гоняли свою "дату" несколько дольше. Даже если заключить контракт на 3 года – пара таких "инстансов" станет в 200к денег, за эти самые три года. Sorry, но пару квад-сокет тазиков с 2тб рама – я куплю сильно дешевле 200k.
У облаков есть свои очешуительные comfort zones (много разнесенных тазиков из-за особенностей ворклоадов – как минимум сильно экономят на сетевом оборудовании и профильных инженеграх, и, почти точно – на трафике). High-performance BI, когда тебе нет нужды ни в релокациях по шарику, ни в gb/10gb аплинках в мир с тазика – никак не зона комфорта облаков thus far. Не говоря уже о том, что в данном случае – притуалетный стервер by default будет несколько менее палевной темой, чем cdn, у которого весь инструментарий приватности – несложно угадываемое "хитрое" доменное имя :(
Re: Легко
Date: 2017-06-22 09:39 am (UTC)И нет, во-первых, s3 это не cdn, во-вторых, знать url недостаточно, по умолчанию все приватное. Т.е. тут кто-то особо умный настройки поменял.
Re: Легко
Date: 2017-06-22 11:09 am (UTC)Аллах с Вами. Cisco (че, не будем дешевить) C460M4 c 4X E7-4850V3 (просто листинги с ебея, состояние new) и 2мя терабайтами рама встанет штук в 20-25-30, вряд ли больше. Шасси умеет 6ТБ, никакой амазон стоко не даст.
Если есть возможность понекрофилить, C260M2 или 460M2 с терабайтом – можно собрать за штук 6-7-8. А если повезет – то штуки за 3:
http://www.ebay.com/itm/Cisco-UCS-C460-M2-High-End-Server-4x-Xeon-E7-4830-2-13ghz-8-Core-1-Terabyte-
RAM-/351960325958?hash=item51f2785f46:g:GgUAAOSw9GhYf43R
200к – это пара откасокетников с космическим размером рама. За что спасибо нужно сказать амазону - это то, что профитмаржины всяких там продаванов деллов, новорусских, IBMом и прочих цисок с тианами и супермикрами, как новых, так и некрофильских/рефурбишнутых – конкретно просели и цены повернулись "к покупателю лицом". А то и правда все – народ в облака уйдет, а эти ребята либо major брэнды не берут, либо берут в специфических конфигурациях и с очешуительными, заоблачными для обычных сяоженей скидками.
А когда настанет окончательный мурокапец – все станет еще интереснее :)
Думаю, что амазон железяку под свои мега-инстансы с 2ТБ рама отбивает где-то за 5-8месяцев. Дальше – чистый профит.