5 ошибок, которые люди совершают, делясь визуализациями данных COVID-19 в Twitter

5 mistakes people make when sharing COVID-19 data visualizations on Twitter0

Изображение Франческо Кафаро и др.

Более 25 процентов визуализаций данных, связанных с коронавирусом, проанализированных в Twitter (синим цветом), не смогли четко указать свои источники информации, что снизило надежность.

5 mistakes people make when sharing COVID-19 data visualizations on Twitter1

Фото Лиз Кэй, магазины

Франческо Кафаро

Предыдущий Следующий

Newswise — INDIANAPOLIS-безумный водоворот обмена информацией, связанной с коронавирусом, который произошел в этом году в социальных сетях, является предметом нового анализа, проведенного исследователями из школы информатики и вычислительной техники IUPUI.

Опубликованное в журнале открытого доступа Informatics, исследование фокусируется на обмене визуализациями данных в Twitter-как экспертами в области здравоохранения, так и обычными гражданами-во время первоначальной борьбы за понимание масштабов пандемии COVID-19 и ее последствий для общества. Многие пользователи социальных сетей продолжают сталкиваться с подобными диаграммами и графиками каждый день, особенно в связи с тем, что по всему миру начала расти новая волна случаев заболевания коронавирусом.

В ходе работы было обнаружено, что более половины анализируемых визуализаций от обычных пользователей содержат одну из пяти распространенных ошибок, которые снижают их ясность, точность или надежность.

«Эксперты еще не начали исследовать мир случайных визуализаций в Twitter», — сказал Франческо Кафаро, доцент Школы информатики и вычислительной техники, который руководил исследованием. «Изучение новых способов, которыми люди обмениваются информацией в интернете, чтобы понять пандемию и ее влияние на их жизнь, является важным шагом в навигации по этим неизведанным водам.»

Случайные визуализации данных относятся к диаграммам и графикам, которые полагаются на инструменты, доступные обычным пользователям, чтобы визуально изобразить информацию лично значимым образом. Эти визуализации отличаются от традиционных визуализаций данных тем, что они не генерируются и не распространяются традиционными «хранителями» медицинской информации, такими как центры по контролю и профилактике заболеваний или Всемирная организация здравоохранения, или средствами массовой информации.

«Реальность такова, что люди зависят от этих визуализаций, чтобы принимать важные решения о своей жизни: безопасно ли отправлять своих детей обратно в школу, безопасно ли брать отпуск и куда идти», — сказал Кафаро. «Учитывая их влияние, мы чувствовали, что важно понять больше о них и выявить общие проблемы, которые могут заставить людей, создающих или просматривающих их, неверно интерпретировать данные, часто непреднамеренно.»

Для исследования исследователи IU обшарили Twitter, чтобы идентифицировать 5409 визуализаций данных, которыми они поделились в социальной сети в период с 14 апреля по 9 мая 2020 года. Из них 540 были выбраны случайным образом для анализа-с полным статистическим анализом, зарезервированным для 435 визуализаций, основанных на дополнительных критериях. Из них 112 были сделаны среднестатистическими гражданами.

В целом, по словам Кафаро, исследование выявило пять подводных камней, общих для анализируемых визуализаций данных. Помимо выявления этих проблем, авторы исследования предлагают шаги по преодолению или снижению их негативного воздействия:

  • Недоверие: Более 25 процентов проанализированных сообщений не смогли четко определить источник своих данных, посеяв недоверие к точности. Эта информация часто была скрыта из-за плохого дизайна-например, плохого выбора цвета, занятого макета или опечаток-а не преднамеренного запутывания. Чтобы преодолеть эти проблемы, авторы исследования предлагают четко маркировать источники данных, а также размещать эту информацию на самой графике, а не на сопроводительном тексте, поскольку изображения часто не связаны с их первоначальным постом во время социального обмена.
  • Пропорциональное рассуждение: Одиннадцать процентов сообщений демонстрировали проблемы, связанные с пропорциональным рассуждением, которое относится к способности пользователей сравнивать переменные, основанные на соотношениях или дробях. Например, понимание уровня инфицирования в различных географических точках является проблемой пропорционального рассуждения, поскольку одинаковое количество инфекций может указывать на различные уровни тяжести в условиях низкой и высокой численности населения. Чтобы преодолеть эту проблему, авторы исследования предлагают использовать такие метки, как число инфекций на 1000 человек, для сравнения регионов с разрозненными популяциями, поскольку этот показатель легче понять, чем абсолютные цифры или проценты.
  • Временные рассуждения: Исследователи выявили 7 процентов сообщений с проблемами, связанными с временным мышлением, которое относится к способности пользователей понимать изменения с течением времени. Они включали визуализации, которые сравнивали число смертей от гриппа за полный год с числом смертей от COVID-19 за несколько месяцев, или визуализации, которые не учитывали задержку между датой заражения и смертями. Рекомендации по решению этих проблем включали разбивку показателей, зависящих от различных временных масштабов, на отдельные диаграммы, в отличие от передачи данных на одной диаграмме.
  • Когнитивная предвзятость: небольшой процент сообщений (0,5%) содержал текст, который, по-видимому, побуждал пользователей неверно интерпретировать данные, основанные на «предубеждениях автора, связанных с расой, страной и иммиграцией».» Исследователи утверждают, что информация должна быть представлена четкими, объективными описаниями, тщательно отделенными от любого сопутствующего политического комментария.
  • Неверное представление о вирусе: два процента визуализаций были основаны на неверном понимании нового коронавируса, например, на использовании данных, связанных с ОРВИ или гриппом.

Исследование также показало, что определенные типы визуализации данных наиболее эффективно выполняются в социальных сетях. Наиболее часто использовались визуализации данных, которые демонстрировали изменения с течением времени, такие как линейчатые или гистограммные графики. Они также обнаружили, что пользователи чаще обращались к диаграммам, показывающим число смертей, а не число инфекций или воздействие на экономику, предполагая, что люди были больше заинтересованы в летальности вируса, чем в других его негативных последствиях для здоровья или общества.

«Задача точной передачи информации визуально не ограничивается обменом информацией в Twitter, но мы считаем, что эти сообщения следует рассматривать особенно тщательно, учитывая влияние социальных сетей на принятие решений людьми»,-сказал Кафаро. «Мы считаем, что наши результаты могут помочь правительственным учреждениям, средствам массовой информации и обычным гражданам лучше понять типы информации, о которых люди заботятся больше всего, а также проблемы, с которыми люди могут столкнуться при интерпретации визуальной информации, связанной с пандемией.»

Другими ведущими авторами исследования являются Милка Трайкова, Аешах Альхаками, Саника Ведак, Рашми Маллаппа и Срикант Р. Канкара, научные сотрудники школы информатики и вычислительной техники IUPUI на момент проведения исследования. В настоящее время альхаками преподает в Университете университета Табук в Саудовской Аравии.

СМ. ОРИГИНАЛЬНОЕ ИССЛЕДОВАНИЕ

Понравилась статья? Поделиться с друзьями:
Коронавирус-2