10 фактов о больших данных, которые вы должны знать

46

В последние годы везде, куда бы вы ни пошли, все, что вы читаете в Интернете, вы видите термин «большие данные». Люди могут представить это как триллионы триллионов текущих «матричных» чисел и цифр. Но что на самом деле означают для нас «большие данные»? Мы только находимся в начале «революции данных», которая затронет каждый бизнес и каждую жизнь на этой планете, и это то, что мы не можем игнорировать. Не верите мне? Вот 10 фактов, которые говорят сами за себя, чтобы нарисовать реалистичную картину этой революции. Вот 10 фактов о больших данных, которые вам необходимо знать:

10 большие данные – это буквально большие данные

«Большие данные», как их еще называют, на самом деле связаны с большими наборами данных. Один из самых удивительных фактов о больших данных заключается в том, что они намного больше, чем то, что мы обычно думаем о «больших». Хотя у разных людей может быть разное определение «больших данных» и что у него нет строгого определения, вот два точных и убедительных определения. McKinsey определяет большие данные как «наборы данных, размер которых превышает возможности типичных программных инструментов баз данных для сбора, хранения, управления и анализа». Майер-Шенбергер и Цукьер написали в своей книге: «Большие данные относятся к вещам, которые можно сделать в большом масштабе, но нельзя сделать в меньшем, для извлечения новых идей или создания новых форм ценности таким образом, чтобы изменить рынки, организации, отношения между гражданами и правительствами и многое другое ». Чтобы проиллюстрировать, насколько велики «большие данные»,

– Каждую секунду мы создаем новые данные. Например, мы выполняем более 50 000 поисковых запросов каждую секунду (только в Google).

– В августе 2015 года более 1 миллиарда человек использовали Facebook за один день.

– Пользователи Facebook отправляют в среднем 31,25 миллиона сообщений и просматривают 2,77 миллиона видео каждую минуту.

– Каждую минуту только на YouTube загружается до 300 часов видео.

Такой объем данных не мог быть обработан с помощью традиционных технологий баз данных и машин более десяти лет назад. Новые технологии, такие как Hadoop и Spark, появились, чтобы использовать возможности, лежащие в основе экспоненциального роста объема данных, генерируемых каждый день.

9 Мы все вносим свой вклад в большие данные

Это один из самых удивительных фактов о больших данных. Как упоминалось выше, ежедневно создаются большие объемы данных, в основном в результате нашей повседневной деятельности в Интернете, такой как поиск в Google, публикация сообщений в Facebook, твиты, хотя они генерируются активными действиями пользователей, некоторые наборы данных производятся данные, собранные в результате пассивного поведения пользователей, например, продолжительность чтения пользователями определенной онлайн-статьи. Мы действительно не замечаем, когда генерируем данные, мы можем просто использовать свой телефон, делать селфи, смотреть видео, но то, что мы делаем, имеет решающее значение для владельцев сайтов и предприятий, и, что более важно, мы вносим в это свой вклад. Революция «больших данных», внося свой вклад в одну из самых фундаментальных частей – генерацию данных.

8 Данные очень много значат для бизнеса


Компании теперь могут получать информацию о своих пользователях и клиентах более комплексным и интерактивным способом, вместо традиционных способов, таких как телефонный опрос. Одним из наиболее интригующих фактов о больших данных является то, что многие корпорации сейчас внедряют «большие данные» в качестве поддержки своего основного бизнеса.

Хорошо известным примером является то, что Google корректирует свои рекомендации автозаполнения на основе привычек пользователей и другой информации, например, если я программист из Кореи, и я довольно долго использовал Google, когда ищу «Python» (язык программирования), он автоматически ставит сайты, посвященные языку программирования Python, в приоритет, вместо того, чтобы показывать информацию о змейках. Google также будет знать, какую рекламу показывать, чтобы пользователь чувствовал себя менее раздраженным, а маркетинговые преимущества можно было увеличить.

Большие данные также используются люксовыми брендами. PRADA устанавливает RFID-сканеры в примерочных в рамках своего проекта «умная примерочная», чтобы показать тенденции, которые дизайнеры одежды и розничные торговцы могут использовать для увеличения продаж. Другой пример: например, когда мы занимаемся серфингом в Интернете, мы естественным образом реагируем на онлайн-контент, который мы просто читаем и перемещаемся в зависимости от того, что нам нравится. И это дает владельцам сайтов и предприятиям важную информацию, позволяющую изучать поведение пользователей и корректировать свои маркетинговые стратегии и дизайн продукта. Компании, у которых есть собственные блоги, будут чрезвычайно полезны для понимания своих клиентов.

7 Правительства тоже используют большие данные


Одним из наиболее важных фактов о больших данных является то, что они сыграли ключевую роль в предвыборной кампании президента США Обамы, более 1000 оплачиваемых сотрудников работали над кампанией, 2,2 миллиона волонтеров и в общей сложности более 100 аналитиков данных, которые провели более 66000 человек. компьютерные симуляции каждый день. Целью кампании Джима Мессины было «все измерить».

Идея заключалась в том, чтобы потребовать данные обо всем, что происходило во время кампании, чтобы все измерить и убедиться, что они все сообразительны. Правительства считают большие данные чрезвычайно важным инструментом для получения информации о мнениях и требованиях граждан (при условии, что они будут слушать людей), поскольку они обеспечивают почти в реальном времени комплексные обновления общественных мнений и демографической информации. Правительства также используют его для различных аспектов повседневной деятельности города, и это будет обсуждаться в следующих фактах.

6 Большие данные – это не только для бизнеса


Олимпийские власти Лондона использовали большие данные для эффективного улучшения условий дорожного движения. Во время Олимпиады каждый водитель тратит в среднем 3 дня на пробки, и Транспорт для Лондона отмечает, что в среднем каждый день будет происходить 300 дорожно-транспортных происшествий. Они включили в себя сеть олимпийских маршрутов, а также технику оптимизации смещения с разбивкой по циклам для отслеживания транспортного потока и его оптимизации, контролируя продолжительность действия красных светофоров.

5 Это может спасти вашу жизнь


Производители фармацевтических препаратов связывают гигантские объемы данных геномики и других исследований, чтобы лучше понять болезни и взаимодействия лекарств; это огромный толчок в исследованиях и разработках лекарств. Более эффективные лекарства, особенно те, которые нацелены на рак и хронические заболевания, вероятно, будут производиться в гораздо больших количествах в ближайшем будущем. Располагая большими данными, врачи смогут оценивать и оценивать эффективность методов лечения, таким образом сопоставляя пациентов с подходящими клиническими испытаниями, распространяя разработку и одобрение новых лекарств и проливая свет на экономически эффективные методы лечения.

4 большие данные, помогающие бороться с болезнями


Один из важнейших фактов о больших данных заключается в том, что они использовались для лучшего понимания мобильности людей во время пандемии, для построения реалистичных моделей распространения инфекционных заболеваний и для иллюстрации воздействия государственного вмешательства на сдерживание пандемии. Правительство могло бы использовать большие данные для моделирования в реальном времени того, как меры государственной политики влияют на потоки мобильности и уровень заболеваемости. С эпидемиями можно бороться в глобальном масштабе, эффективность в случае лихорадки Эбола доказана. Google Flu Trends реализует аналитику данных для прогнозирования распространения гриппа, так что профилактика может быть сделана заранее.

3 «Правосудие с помощью больших данных?»


Большие данные могут использоваться в предупреждении преступности, раскрытии преступлений и национальной безопасности. Характер преступности можно предсказать, и предупреждение преступности хорошо зарекомендовало себя с большими данными (хотя при этом возникают различные этические проблемы). Большие данные также являются отличным оружием против мошенничества, транзакции можно отслеживать, а аномалии обнаруживать очень эффективно и точно. Можем ли мы добиться справедливости с помощью больших данных? Возможно, мы узнаем ответ в ближайшем будущем.

2 Темная сторона больших данных


Внедрение больших данных имеет различные недостатки. Это один из менее концентрированных фактов о больших данных. Например, конфиденциальность сложнее защитить, потому что традиционные правовые и технические механизмы не работают с большими данными, наборы данных могут содержать конфиденциальную информацию, включая личный идентификатор и информацию о вашем доходе, привычках и предпочтениях, которые могут быть использованы бизнеса, поскольку это означает для них огромную прибыль. Более того, большие данные, вероятно, будут внедряться в таких секторах, как финансы и медицина, финансовая информация о физических лицах и медицинские записи, которые, как мы предпочитаем, никто не знает, будут первоочередными целями для хакеров. Большие данные также могут использоваться в качестве инструмента наблюдения, которое нарушает частную жизнь и права людей.

С другой стороны, в эпоху больших данных проблема будет заключаться в защите свободы воли, морального выбора, человеческой воли, человеческой свободы воли. Это скорее философский вопрос, и он более или менее похож на споры о развитии искусственного интеллекта.

И последнее, но не менее важное: больше людей будут безработными из-за больших данных. Поскольку машины будут умнее извлекать инсайты – работу, которую обычно выполняет человек, – предсказуемо большая потеря рабочих мест. Финансовый и деловой секторы, вероятно, пострадают больше всего, так как маркетинговый анализ теперь может выполняться машинами с аналитикой данных, и что даже цены на акции могут быть предсказаны с помощью аналитики больших данных, мы могли легко представить себе множество рабочих мест в отделах маркетинга и инвестиций. банки будут потеряны из-за возникновения этой революции больших данных.

1 С каждым днем ​​он растет быстрее


Растущая популярность и применение Интернета, персональных компьютеров и связанных с ними технологий привели к огромному увеличению объема создаваемых данных, количество данных в Интернете росло экспоненциально, с 2005 по 2012 год оно увеличилось на 1696%, и рост, вероятно, ускорится. в ближайшем будущем в связи с ростом популярности Интернета, социальных сетей, персональных компьютеров и мобильных устройств. Ожидается, что индустрия больших данных вырастет с 10,2 млрд долларов США в 2013 году до примерно 54,3 млрд долларов США к 2017 году. Революция больших данных имеет ряд плюсов и минусов, и очевидно, что никто из нас не может закрыть глаза на это.

  1. Он растет быстрее с каждым днем
  2. Темная сторона больших данных
  3. Правосудие через большие данные?
  4. Большие данные помогают бороться с болезнями
  5. Большие данные могут спасти вашу жизнь
  6. Большие данные – это не только бизнес
  7. Правительства тоже используют большие данные
  8. Данные очень много значат для бизнеса
  9. Мы все вносим свой вклад в большие данные
  10. Большие данные – это буквально большие данные

Автор: CO-One

Источник записи: wonderslist.com

Этот веб-сайт использует файлы cookie для улучшения вашего опыта. Мы предполагаем, что вы согласны с этим, но вы можете отказаться, если хотите. Принимаю Подробнее