10 фактов о больших данных, которые вы должны знать
В последние годы везде, куда бы вы ни пошли, все, что вы читаете в Интернете, вы видите термин «большие данные». Люди могут представить это как триллионы триллионов текущих «матричных» чисел и цифр. Но что на самом деле означают для нас «большие данные»? Мы только находимся в начале «революции данных», которая затронет каждый бизнес и каждую жизнь на этой планете, и это то, что мы не можем игнорировать. Не верите мне? Вот 10 фактов, которые говорят сами за себя, чтобы нарисовать реалистичную картину этой революции. Вот 10 фактов о больших данных, которые вам необходимо знать:
10 большие данные — это буквально большие данные
«Большие данные», как их еще называют, на самом деле связаны с большими наборами данных. Один из самых удивительных фактов о больших данных заключается в том, что они намного больше, чем то, что мы обычно думаем о «больших». Хотя у разных людей может быть разное определение «больших данных» и что у него нет строгого определения, вот два точных и убедительных определения. McKinsey определяет большие данные как «наборы данных, размер которых превышает возможности типичных программных инструментов баз данных для сбора, хранения, управления и анализа». Майер-Шенбергер и Цукьер написали в своей книге: «Большие данные относятся к вещам, которые можно сделать в большом масштабе, но нельзя сделать в меньшем, для извлечения новых идей или создания новых форм ценности таким образом, чтобы изменить рынки, организации, отношения между гражданами и правительствами и многое другое ». Чтобы проиллюстрировать, насколько велики «большие данные»,
— Каждую секунду мы создаем новые данные. Например, мы выполняем более 50 000 поисковых запросов каждую секунду (только в Google).
— В августе 2015 года более 1 миллиарда человек использовали Facebook за один день.
— Пользователи Facebook отправляют в среднем 31,25 миллиона сообщений и просматривают 2,77 миллиона видео каждую минуту.
— Каждую минуту только на YouTube загружается до 300 часов видео.
Такой объем данных не мог быть обработан с помощью традиционных технологий баз данных и машин более десяти лет назад. Новые технологии, такие как Hadoop и Spark, появились, чтобы использовать возможности, лежащие в основе экспоненциального роста объема данных, генерируемых каждый день.
9 Мы все вносим свой вклад в большие данные
Это один из самых удивительных фактов о больших данных. Как упоминалось выше, ежедневно создаются большие объемы данных, в основном в результате нашей повседневной деятельности в Интернете, такой как поиск в Google, публикация сообщений в Facebook, твиты, хотя они генерируются активными действиями пользователей, некоторые наборы данных производятся данные, собранные в результате пассивного поведения пользователей, например, продолжительность чтения пользователями определенной онлайн-статьи. Мы действительно не замечаем, когда генерируем данные, мы можем просто использовать свой телефон, делать селфи, смотреть видео, но то, что мы делаем, имеет решающее значение для владельцев сайтов и предприятий, и, что более важно, мы вносим в это свой вклад. Революция «больших данных», внося свой вклад в одну из самых фундаментальных частей — генерацию данных.
8 Данные очень много значат для бизнеса
Компании теперь могут получать информацию о своих пользователях и клиентах более комплексным и интерактивным способом, вместо традиционных способов, таких как телефонный опрос. Одним из наиболее интригующих фактов о больших данных является то, что многие корпорации сейчас внедряют «большие данные» в качестве поддержки своего основного бизнеса.
Хорошо известным примером является то, что Google корректирует свои рекомендации автозаполнения на основе привычек пользователей и другой информации, например, если я программист из Кореи, и я довольно долго использовал Google, когда ищу «Python» (язык программирования), он автоматически ставит сайты, посвященные языку программирования Python, в приоритет, вместо того, чтобы показывать информацию о змейках. Google также будет знать, какую рекламу показывать, чтобы пользователь чувствовал себя менее раздраженным, а маркетинговые преимущества можно было увеличить.
Большие данные также используются люксовыми брендами. PRADA устанавливает RFID-сканеры в примерочных в рамках своего проекта «умная примерочная», чтобы показать тенденции, которые дизайнеры одежды и розничные торговцы могут использовать для увеличения продаж. Другой пример: например, когда мы занимаемся серфингом в Интернете, мы естественным образом реагируем на онлайн-контент, который мы просто читаем и перемещаемся в зависимости от того, что нам нравится. И это дает владельцам сайтов и предприятиям важную информацию, позволяющую изучать поведение пользователей и корректировать свои маркетинговые стратегии и дизайн продукта. Компании, у которых есть собственные блоги, будут чрезвычайно полезны для понимания своих клиентов.
7 Правительства тоже используют большие данные
Одним из наиболее важных фактов о больших данных является то, что они сыграли ключевую роль в предвыборной кампании президента США Обамы, более 1000 оплачиваемых сотрудников работали над кампанией, 2,2 миллиона волонтеров и в общей сложности более 100 аналитиков данных, которые провели более 66000 человек. компьютерные симуляции каждый день. Целью кампании Джима Мессины было «все измерить».
Идея заключалась в том, чтобы потребовать данные обо всем, что происходило во время кампании, чтобы все измерить и убедиться, что они все сообразительны. Правительства считают большие данные чрезвычайно важным инструментом для получения информации о мнениях и требованиях граждан (при условии, что они будут слушать людей), поскольку они обеспечивают почти в реальном времени комплексные обновления общественных мнений и демографической информации. Правительства также используют его для различных аспектов повседневной деятельности города, и это будет обсуждаться в следующих фактах.
6 Большие данные — это не только для бизнеса
Олимпийские власти Лондона использовали большие данные для эффективного улучшения условий дорожного движения. Во время Олимпиады каждый водитель тратит в среднем 3 дня на пробки, и Транспорт для Лондона отмечает, что в среднем каждый день будет происходить 300 дорожно-транспортных происшествий. Они включили в себя сеть олимпийских маршрутов, а также технику оптимизации смещения с разбивкой по циклам для отслеживания транспортного потока и его оптимизации, контролируя продолжительность действия красных светофоров.
5 Это может спасти вашу жизнь
Производители фармацевтических препаратов связывают гигантские объемы данных геномики и других исследований, чтобы лучше понять болезни и взаимодействия лекарств; это огромный толчок в исследованиях и разработках лекарств. Более эффективные лекарства, особенно те, которые нацелены на рак и хронические заболевания, вероятно, будут производиться в гораздо больших количествах в ближайшем будущем. Располагая большими данными, врачи смогут оценивать и оценивать эффективность методов лечения, таким образом сопоставляя пациентов с подходящими клиническими испытаниями, распространяя разработку и одобрение новых лекарств и проливая свет на экономически эффективные методы лечения.
4 большие данные, помогающие бороться с болезнями
Один из важнейших фактов о больших данных заключается в том, что они использовались для лучшего понимания мобильности людей во время пандемии, для построения реалистичных моделей распространения инфекционных заболеваний и для иллюстрации воздействия государственного вмешательства на сдерживание пандемии. Правительство могло бы использовать большие данные для моделирования в реальном времени того, как меры государственной политики влияют на потоки мобильности и уровень заболеваемости. С эпидемиями можно бороться в глобальном масштабе, эффективность в случае лихорадки Эбола доказана. Google Flu Trends реализует аналитику данных для прогнозирования распространения гриппа, так что профилактика может быть сделана заранее.
3 «Правосудие с помощью больших данных?»
Большие данные могут использоваться в предупреждении преступности, раскрытии преступлений и национальной безопасности. Характер преступности можно предсказать, и предупреждение преступности хорошо зарекомендовало себя с большими данными (хотя при этом возникают различные этические проблемы). Большие данные также являются отличным оружием против мошенничества, транзакции можно отслеживать, а аномалии обнаруживать очень эффективно и точно. Можем ли мы добиться справедливости с помощью больших данных? Возможно, мы узнаем ответ в ближайшем будущем.
2 Темная сторона больших данных
Внедрение больших данных имеет различные недостатки. Это один из менее концентрированных фактов о больших данных. Например, конфиденциальность сложнее защитить, потому что традиционные правовые и технические механизмы не работают с большими данными, наборы данных могут содержать конфиденциальную информацию, включая личный идентификатор и информацию о вашем доходе, привычках и предпочтениях, которые могут быть использованы бизнеса, поскольку это означает для них огромную прибыль. Более того, большие данные, вероятно, будут внедряться в таких секторах, как финансы и медицина, финансовая информация о физических лицах и медицинские записи, которые, как мы предпочитаем, никто не знает, будут первоочередными целями для хакеров. Большие данные также могут использоваться в качестве инструмента наблюдения, которое нарушает частную жизнь и права людей.
С другой стороны, в эпоху больших данных проблема будет заключаться в защите свободы воли, морального выбора, человеческой воли, человеческой свободы воли. Это скорее философский вопрос, и он более или менее похож на споры о развитии искусственного интеллекта.
И последнее, но не менее важное: больше людей будут безработными из-за больших данных. Поскольку машины будут умнее извлекать инсайты — работу, которую обычно выполняет человек, — предсказуемо большая потеря рабочих мест. Финансовый и деловой секторы, вероятно, пострадают больше всего, так как маркетинговый анализ теперь может выполняться машинами с аналитикой данных, и что даже цены на акции могут быть предсказаны с помощью аналитики больших данных, мы могли легко представить себе множество рабочих мест в отделах маркетинга и инвестиций. банки будут потеряны из-за возникновения этой революции больших данных.
1 С каждым днем он растет быстрее
Растущая популярность и применение Интернета, персональных компьютеров и связанных с ними технологий привели к огромному увеличению объема создаваемых данных, количество данных в Интернете росло экспоненциально, с 2005 по 2012 год оно увеличилось на 1696%, и рост, вероятно, ускорится. в ближайшем будущем в связи с ростом популярности Интернета, социальных сетей, персональных компьютеров и мобильных устройств. Ожидается, что индустрия больших данных вырастет с 10,2 млрд долларов США в 2013 году до примерно 54,3 млрд долларов США к 2017 году. Революция больших данных имеет ряд плюсов и минусов, и очевидно, что никто из нас не может закрыть глаза на это.
- Он растет быстрее с каждым днем
- Темная сторона больших данных
- Правосудие через большие данные?
- Большие данные помогают бороться с болезнями
- Большие данные могут спасти вашу жизнь
- Большие данные — это не только бизнес
- Правительства тоже используют большие данные
- Данные очень много значат для бизнеса
- Мы все вносим свой вклад в большие данные
- Большие данные — это буквально большие данные
Автор: CO-One