Исследователи моделируют утечки конфиденциальной информации в исследованиях функциональной геномики

Область функциональной геномики, которая изучает активность генома и уровни экспрессии генов, а не конкретные генные мутации, обычно полагается на агрегирование информации из многих образцов для ее статистической мощности. Это означает, что широкое распространение необработанных данных жизненно важно; однако обмен этими данными в настоящее время затруднен из-за опасений по поводу конфиденциальности отдельных лиц в этих наборах данных, что приводит к тому, что эти данные в основном недоступны за брандмауэрами. В исследовании, опубликованном 12 ноября в журнале Cell, группа исследователей демонстрирует, что эти данные можно деидентифицировать, чтобы обеспечить конфиденциальность пациентов. Они также демонстрируют, как эти необработанные данные могут быть связаны с конкретными людьми через их варианты генов с помощью чего-то столь же простого, как брошенная чашка кофе, если эти санитарные меры не будут приняты.

«Цель этого исследования – найти практические способы широкого обмена необработанными данными, не создавая ненужных проблем с конфиденциальностью» , – говорит старший автор Марк Герштейн, профессор биоинформатики Йельского университета.

Исследования функциональной геномики часто привязаны к конкретному заболеванию. Например, при исследовании определенного психического состояния можно изучить экспрессию определенных генов в определенном типе нейрона. И в силу того, что их генетический материал включен в такое исследование, медицинский статус человека в отношении этого состояния может быть непреднамеренно раскрыт.

Это может происходить через так называемый квазиидентификатор. Принцип работы квазиидентификатора заключается в том, что если у кого-то имеется достаточно отдельных точек данных о вас, даже если эти данные сами по себе не являются конфиденциальными или уникальными, их можно объединить для создания идентификатора, уникального для вас. В негенетических условиях это означает, что если у кого-то есть ваш почтовый индекс, дата рождения, модель автомобиля, на котором вы водите, и другие подобные данные, которые сами по себе не могут считаться конфиденциальными или конфиденциальными, они, возможно, в конечном итоге смогут объединить их и создайте уникальный профиль, который свяжет вас с другими данными, которые вы не хотели бы публиковать, – например, с финансовыми записями, которые были собраны, когда вы подали заявку на автокредит. То же самое могло бы произойти, если бы кто-то смог получить некоторые из ваших генетических вариантов и связать эти варианты с наличием вашего генетического материала в исследовании конкретного заболевания. Это, в свою очередь, может выявить диагноз, например ВИЧ-статус или унаследованную предрасположенность к раку, о котором вы бы предпочли не говорить.

В своем исследовании исследователи разработали сценарий «атаки сцепления», чтобы продемонстрировать, как кто-то может установить такие связи из данных исследований функциональной геномики, используя ДНК, полученную из выброшенной кофейной чашки. После добавления образцов от двух согласившихся участников в базу данных функциональной геномики исследователи собрали использованные кофейные чашки от одних и тех же людей. Они секвенировали генетический материал, оставленный на чашках, и смогли успешно сопоставить этот материал с образцами в базе данных и получить конфиденциальную информацию о здоровье участников. Исследователи также смогли использовать информацию ДНК, «украденную» из базы данных генотипов, чтобы сопоставить личности 421 человека с фенотипической информацией, найденной в тестовом наборе данных функциональной геномики, который исследователи построили для 436 человек.

услуги нутрициологаАвтор сайта и статей: Наталья Степанова, нутрициолог-психолог, консультант по питанию и коррекции веса. Подробнее обо мне

Я в соц. сетях: Vk, Instagram.

Рейтинг
Еще статьи нутрициолога:
Adblock
detector