Новое достижение учёных из Microsoft позволит создать эксабайтные диски
Друзья, с момента основания проекта прошло уже 20 лет и мы рады сообщать вам, что сайт, наконец, переехали на новую платформу.
Какое-то время продолжим трудится на общее благо по адресу
На новой платформе мы уделили особое внимание удобству поиска материалов.
Особенно рекомендуем познакомиться с работой рубрикатора.
Спасибо, ждём вас на N-N-N.ru
Перспектива появления огромных хранилищ данных, основанных на ДНК, стала вполне реальной благодаря новому методу извлечения данных.
Уже сейчас Microsoft видит в синтетической ДНК перспективный носитель информации, который сможет удовлетворить потребности в хранении больших данных. Предыдущие исследования показали, что всего лишь несколько грамм ДНК способны хранить в себе эксабайт данных, при этом срок их хранения составляет около 2000 лет.
Но главным недостатком этой технологии явялется дороговизна и медленность записи, которая включает в себя преобразование нулей и единиц в сенуклеотиды. Извлечение данных из ДНК представляет собой секвенирование и обратный перевод файлов в нули и единицы. Поиск и извлечение определенных файлов также является большой проблемой.
Но это осталось в прошлом — ученые из Microsoft Research и Вашингтонского университета впервые получили произвольный доступ к ДНК-носителю в крупном масштабе. Как они объяснили, отсутствие произвольного доступа или возможности выборочного извлечения файлов из ДНК-хранилища приводит к тому, что для нахождения нужных файлов пользователь должен секвенировать и декодировать весь набор данных. Получение произвольного доступа позволит уменьшить количество операций по секвенированию.
Для получения произвольного доступа к ДНК учёные создали библиотеку праймеров, которые прикреплены к каждой последовательности молекулы и используются в качестве мишеней для выбора нужных её фрагментов.
Исследователи также разработали алгоритм для более эффективного декодирования и восстановления данных. Старший научный сотрудник Microsoft Сергей Еханин отметил, что новые алгоритмы более терпимы к ошибкам в написании и чтении последовательностей ДНК, что сокращает секвенирование и обработку данных, необходимую для их восстановления.
В синтетической ДНК было закодировано 200 мегабайт данных, состоящих из 35 файлов объёмом от 29 килобайт до 44 мегабайт. В данных файлах содержатся HD-видео, аудиофайлы, изображения и тексты. Учёные полагают, что метод, который они использовали для случайного доступа, будет масштабироваться до физически изолированных ДНК-пулов, способных вмещать в себя несколько терабайт.
- Источник(и):
- Войдите на сайт для отправки комментариев