Почему астероиды гражданской науки используют компьютеры
Официальный сайт правительства США
Вот откуда ты знаешь
.gov означает, что это официально.
Веб-сайты федерального правительства всегда используют домен .gov или .mil. Прежде чем делиться конфиденциальной информацией в Интернете, убедитесь, что вы находитесь на сайте .gov или .mil, проверив адресную строку (или «местоположение») своего браузера.
Этот сайт также защищен сертификатом SSL (Secure Sockets Layer), подписанным правительством США. https:// означает, что все передаваемые данные зашифрованы — другими словами, любая информация или история просмотров, которые вы предоставляете, передаются безопасно.
Меню
- Шаг 1 | Масштаб вашей проблемы
- Шаг 2 | Разработать проект
- Шаг 3 | Создайте сообщество
- Управляйте своими данными
- Шаг 5 | Поддерживать и улучшать
Шаг 4 — Управляйте своими данными
Сбор данных является основной целью большинства проектов гражданской науки и краудсорсинга; аналогичные соображения применимы к проектам, которые сосредоточены на обработке данных, например, классификации содержимого изображений. Успешные проекты должны обеспечивать качество, полезность и сохранность данных.
Следующие советы помогут вам начать работу:
- Думайте о своих данных как об активе.
- Подготовьте план управления данными.
- Получите ваши данные.
- Обработайте свои данные.
- Проанализируйте свои данные.
- Поделитесь своими данными.
- Сохраните свои данные.
- Проект OpenPV: краудсорсинг данных о солнечной энергии
- Национальный картографический корпус: краудсорсинг картографических данных
- Партнерство SMAP/GLOBE: гражданские ученые измеряют влажность почвы
- CoCoRaHS — совместная сеть сообщества по дождю, граду и снегу: гражданские ученые отслеживают осадки
- Проект мониторинга личинок монархов: гражданские ученые наблюдают за бабочками монархов
- Project BudBurst: гражданские ученые отслеживают сезонные изменения растений
- Набор инструментов датчика воздуха: гражданские ученые измеряют качество воздуха
- Приложение FCC Speed Test для измерения скорости широкополосного доступа в Америке для Android и iOS: краудсорсинг производительности мобильного широкополосного доступа
Думайте о своих данных как об активе
Чтобы обеспечить полезность ваших данных, думайте о них как об активе с «жизненным циклом данных», состоящим из взаимосвязанных фаз, включая планирование, сбор, обработку, анализ, сохранение и совместное использование. Вам нужно будет ответить на вопросы, связанные с документацией, хранением, обеспечением качества и владением на каждом этапе жизненного цикла данных. На каждом этапе учитывайте сквозные элементы, такие как описание (включая метаданные и документацию), управление качеством, резервное копирование и безопасность.
- Прежде чем приступить к проекту, определите свои потребности в данных. Убедитесь, что собранные вами данные помогут вам достичь общих целей проекта.
- Убедитесь, что волонтеры обладают навыками или обучением, необходимыми для сбора или анализа данных необходимого вам качества.
- Адаптируйте объем сбора данных к потребностям вашего проекта. Убедитесь, что вы собираете данные по правильной пространственной области в течение нужного периода времени. Выборка может быть особенно сложной в гражданской науке из-за естественных предубеждений, но продуманные стратегии могут помочь избежать проблем, связанных с избыточной выборкой в одних областях и недостаточной выборкой в других в течение нужного периода времени.
- Помните о возможных юридических проблемах и проблемах с правом собственности, связанных с данными, которые вы собираете.Выясните, какими типами данных вы будете делиться, кому они принадлежат и кто будет иметь к ним доступ. Убедитесь, что все участники проекта понимают и согласны.
- Жизненный цикл научных данных
- Модель жизненного цикла научных данных Геологической службы США
Подготовьте план управления данными
Планирование управления данными тесно связано со вторым этапом «Как сделать» в этом наборе инструментов (Разработка проекта). Напишите план управления данными, который поможет вам оценить, какой тип данных собирать, как их собирать и какие дополнительные ресурсы вам потребуются — плюс это требуется в соответствии с федеральной политикой открытых данных. Прежде чем разрабатывать конкретный план управления данными, вам необходимо принять во внимание несколько общих соображений.
- В вашем плане вы должны указать:
- стандарты, обязанности и методы сбора данных;
- описание данных (метаданные) и структура (схема);
- оценка данных, обеспечение качества и контроль качества; а также
- методы размещения и сохранения данных, совместного использования, статистического анализа и получения обратной связи
- Какие данные вы собираете? Данные уже существуют?
- Потребуется ли вам использовать данные из внешних источников для достижения целей вашего проекта?
- Кто отвечает за управление данными и план управления данными?
- Как будут собираться данные?
- В каком формате будут данные и их метаданные?
- Как будут проверяться и сертифицироваться данные?
- Каковы возможные варианты использования данных, кто будет их использовать и какие результаты потребуются?
- Как данные будут храниться и резервироваться и как долго?
- Руководство по управлению данными для участия общественности в научных исследованиях
- Инструмент планирования управления данными
- Справочник EPA по обеспечению качества и руководящие документы для проектов гражданской науки
- Федеральная политика открытых данных
- Совет по изучению человека (Википедия)
- Закон о сокращении бумажной работы 1995 г.
- Ускоренный процесс Закона о сокращении бумажной работы (DigitalGov)
- Контрольный список управления данными USGS (PDF)
- Планы управления данными Геологической службы США
Получите ваши данные
Вы можете получать новые данные, собирая их, адаптируя старые данные, делясь данными или обмениваясь ими, а также приобретая данные. В проектах гражданской науки и краудсорсинга, которые включают сбор данных, добровольцы обычно записывают свои эмпирические наблюдения или используют оборудование, такое как камеры, для создания данных. Чем точнее ваши волонтеры собирают данные, тем больше доверия будет к вашему проекту и тем меньше работы вам потребуется для фильтрации и очистки данных позже.
- По возможности используйте стандартные протоколы для сбора данных, чтобы обеспечить согласованность и помочь волонтерам понять, что и когда делать. Протестируйте свои протоколы и вопросы в пилотном проекте, чтобы проверить, насколько они понятны, просты в использовании и точны в результатах. Ожидайте сделать по крайней мере два раунда изменений до запуска.
- Обучите своих волонтеров и предоставьте им информацию, необходимую им для понимания данных, которые они собирают, включая простые для понимания учебные материалы. Подумайте о создании видео; видеообучение может быть столь же эффективным, как и очное обучение.
- Попросив добровольцев сделать фотографии, вы сможете оценить записанные наблюдения или классификации и дать обратную связь. Сами фотографии могут выступать в качестве данных, предоставляя дополнительную информацию помимо письменных или числовых ответов.
- Быть гибким. Рассмотрите ряд инструментов и подходов для сбора необходимых данных.
- Мобильные устройства могут уменьшить количество ошибок, автоматически и последовательно собирая данные, такие как время и местоположение; они также могут упростить обработку фотографий и других данных датчиков. Однако использование исключительно мобильных устройств может ограничить сбор в изолированных районах или исключить людей, которые не могут себе их позволить.
- Рассмотрите возможность применения пользовательской таксономии или другого стандарта, где это уместно, что позволяет вводить данные наблюдений с различными уровнями достоверности.Некоторые участники предпочтут не предоставлять данные, если они не уверены в своих результатах, и их можно либо успокоить, либо предложить средства подтверждения уверенности.
- Рассмотрите возможность использования многих способов сбора данных, особенно если ваш проект требует участия изолированных сообществ или ряда социально-экономических и возрастных групп. (т. е. бумажные листы данных) Наличие вариантов как для нецифрового, так и для цифрового ввода позволит каждому участвовать. Например, участники могут записывать наблюдения с помощью приложения или бумажных вопросников. Если это возможно, вы также можете предоставить добровольцам устройства для сбора данных либо на постоянной основе, либо взаймы.
- Чтобы ваша база данных была чистой и готовой к использованию, следуйте стандартным методам традиционного сбора и ввода данных — например, вы можете формулировать вопросы как множественный выбор или принимать ответы только в виде чисел в определенном диапазоне. Это также снижает вероятность отправки «спама» и мошеннических данных.
- Beach Watch: гражданская наука о береговых условиях
- Mark2Cure: краудсорсинг медицинской литературы для поиска лекарств
- Национальная фенологическая сеть: метаданные для наборов данных по фенологии растений и животных
- Снимок Серенгети: краудсорсинг собирает данные об африканских видах (статья в журнале, 2015 г.)
- Методы сбора данных Геологической службы США
- Управление качеством данных Геологической службы США
Обрабатывайте ваши данные
Синтезируйте свои данные и представьте их в значимом формате на основе соответствующих стандартов данных. Федеральная политика открытых данных и открытого доступа требует, чтобы все данные, полученные для федерального правительства или финансируемые им, были доступны в стандартных форматах и, если возможно, в непатентованных и машиночитаемых форматах.
- Решите, можете ли вы усилить свой проект, собирая данные как от технических специалистов/исследователей, так и от общественности. Структурируйте базы данных в параллельном формате, чтобы можно было легко комбинировать несколько источников данных.
- Внесите данные из альтернативных источников, таких как данные дистанционного зондирования или информацию о погоде, которые помогут вам проверить данные, собранные добровольцами.
- Обязательно ищите выбросы в наборе данных, такие как очень большие или маленькие числа, которые могут указывать на ошибку.
- Когда вы заметите потенциальные ошибки, проверьте, носят ли они какой-либо систематический характер, например, распространенную ошибку ввода данных, которую можно легко исправить с помощью быстрого электронного письма и редактирования учебных материалов. Задокументируйте эти проблемы и внесите соответствующие коррективы.
- Если проект требует существенного изменения процедур, что повлияет на сопоставимость текущих данных, задокументируйте эти изменения и их обоснование и уведомите участников простым языком. Если возможно, предоставьте данные как с исходными значениями, так и со значениями, скорректированными для компенсации измененных методов.
- Используйте лучшие практики управления данными. Например, тщательно документируйте свои методы обработки, чтобы обеспечить целостность ваших данных. Включите сведения о преобразовании данных, таких как объединение значений в диапазоны, а также правила, применяемые для исправления данных, обнаружения ложных или неприемлемых записей и исключения данных из общего доступа (например, измененное разрешение местоположения для наблюдений за уязвимыми видами). Убедитесь, что конфиденциальность участников надлежащим образом защищена во всех общедоступных данных.
- Федеральная политика открытых данных
- Учебник по управлению данными (DataONE)
- Стандарты данных Геологической службы США
Проанализируйте свои данные
Как и в любом научном начинании, анализ помогает документировать и описывать факты, выявлять закономерности, разрабатывать объяснения, проверять гипотезы и проверять их на наличие ошибок. Анализ данных гражданской науки или краудсорсинга не обязательно отличается от анализа данных, собранных другими методами, и может сильно различаться в зависимости от характера исследования и типа данных.Знание того, как вы будете анализировать данные, прежде чем создавать окончательный план сбора, является ключевым. цели проекта.
- Измерьте или учтите ошибку. Подумайте о том, чтобы несколько человек проводили наблюдения, чтобы вы могли оценить разницу между наблюдателями. Если признанные эксперты могут предоставить некоторые наблюдения, вы также можете оценить различия между традиционным и волонтерским сбором данных. При необходимости образцы или ваучеры могут предоставить дополнительные средства для проверки, но в некоторых случаях требование априорных доказательств может быть ненужным барьером.
- Многие статистические системы требуют учета усилий. Определите способы учета усилий, затраченных вашими добровольцами на выполнение своих наблюдений, и убедитесь, что ваши способы учета усилий соответствуют вашему аналитическому методу.
- Некоторая аналитика, характерная для гражданской науки, может дать количественную оценку экономии средств за счет использования добровольцев. Документируйте такие данные, чтобы помочь оценить качество и успех вашего проекта. Волонтерские часы — один из наиболее сопоставимых показателей для разных проектов, и его можно привязать к отчетам об усилиях.
- Перед распространением материалов, предназначенных для широкой публики, проведите обзор материалов, не являющихся учеными.
- Ведра сопротивления: стандарты и эффективность гражданской науки (журнальная статья, 2010 г.)
- Руководство по управлению данными для участия общественности в научных исследованиях (DataONE)
- Открытые данные проекта: управление информацией как активом
Поделитесь своими данными
Одна из целей гражданской науки и краудсорсинга — генерировать данные, которые удовлетворяют потребности вашей организации в фундаментальных исследованиях, решении проблем, разработке политики, поддержке принятия решений или образовании. Вы должны поддерживать свои данные и делиться ими в среде, которую люди могут найти, понять и легко использовать в различных технических и нетехнических контекстах.
Как для необработанных, так и для обработанных данных потребуются точные метаданные (описания данных); метаданные предоставляют важную информацию о наборах данных, включая их принадлежность, происхождение, цель, содержание, объем и структуру; методы обработки и обработки наборов данных; и юридические ограничения на их использование. Эта информация имеет решающее значение для обеспечения полного понимания ваших данных, возможности быстрой оценки их качества и пригодности, успешной интеграции их с другими наборами данных, а также их повторного использования или защиты при необходимости.
- Насколько это возможно, выясните, кому будут нужны ваши данные или кто захочет их увидеть, будь то исследователи, журналисты, политики или конкретное сообщество.
- Определите наиболее эффективные, подходящие для аудитории и экономичные способы предоставления пользователям необходимого доступа к данным. Начните с предоставления простых в использовании инструментов поиска и обнаружения.
- Подумайте, как вы можете представить и интерпретировать свои результаты, чтобы сделать их ясными и понятными для ваших добровольцев и других аудиторий. Переводите результаты на простой язык, используйте простые графики и предлагайте визуализацию на основе карт, где это необходимо.
- Предоставьте самые простые инструменты или методы для визуализации, оценки и сравнения данных, обобщения или абстрагирования (например, карты или ГИС, статистические сводки, диаграммы и графики) и загрузки данных (например, файлы CSV для результатов пользовательских запросов, а также сжатые пакеты предварительно отобранных документированных данных).
- Делясь своими данными, ознакомьтесь со стандартными политиками проверки, утверждения и публикации вашей организации. В частности, не забудьте включить элементы управления для защиты конфиденциальности, служебной или другой ограниченной информации, а также целостности самих данных.
- Убедитесь, что получатели данных могут получить доступ к полным метаданным и другой документации, чтобы они могли оценить, воспроизвести и наилучшим образом использовать ваши результаты. Определите источники, лицензию, методы и содержание данных.
- Сделайте ваши данные доступными для публичного использования помимо ваших собственных неотложных потребностей, в соответствии с федеральными требованиями к открытым данным и открытому доступу. Запрашивать (или требовать), чтобы участники делились оригинальными изображениями по неограниченной лицензии, такой как CC-BY, которая разрешает повторное распространение. Организуйте свои данные, чтобы их можно было найти. При необходимости ограничьте доступ к определенным частям (например, для защиты физически или культурно уязвимых мест сбора или видов, находящихся под угрозой исчезновения).
- Ведра сопротивления: стандарты и эффективность гражданской науки (журнальная статья, 2010 г.)
- Федеральная политика открытых данных
- Управление данными USGS: описание/метаданные
- Выпуск, обмен и публикация данных Геологической службы США
Сохраните свои данные
Планируйте долгосрочное сохранение ваших данных в соответствии с политикой и практикой хранения данных вашего агентства, а также Национального управления архивов и документации. Вы можете сохранить свои данные, заархивировав их или отправив в авторизованный репозиторий данных. Вы должны организовать и документировать свои наборы данных достаточно хорошо, чтобы другие могли понять и повторно использовать их в долгосрочной перспективе. Вы также должны своевременно маркировать и заменять устаревшую информацию.
- Найдите авторизованный репозиторий данных для долгосрочного хранения ваших данных. Одним из примеров является ScienceBase Геологической службы США, которая позволяет хранить множество различных типов данных и связанную информацию о проектах. Существует также множество репозиториев, посвященных конкретным темам и типам данных.
- Организуйте долгосрочное хранение «архивных» данных, то есть данных, которые остаются важными для использования в будущем, но больше не нужны для немедленного доступа.
- Подготовьте архивные данные, проверив их метаданные и документацию на предмет точности и убедившись, что потенциально идентифицирующая личность информация об участниках управляется должным образом.
- Подумайте, как потенциальные будущие пользователи узнают о существовании ваших заархивированных данных, а также о том, что они содержат.Убедитесь, что ваши данные перечислены в каталогах или каталогах данных аналогичных типов (например, MoveBank для данных о перемещениях животных) и в соответствующих федеральных и ведомственных каталогах открытых данных (таких как Data.gov и Data.doi.gov).
- Movebank: Каталог данных отслеживания животных
- Научная база: Каталог данных Геологической службы США
- Управление данными USGS: сохранение
CitizenScience.gov публикуется и поддерживается
Управление общих служб США