Введение
Нажмите на картинку для увеличения.
Хотя компания не использовала маркетинговый термин “думать/think” уже много лет, IBM, определённо, можно назвать одной из самых “умных” технологических компаний в мире. Различными путями IBM перешла из категории производителей ПК в мозговой центр, создающий идеи – и запрашивающий определённые суммы, если вы хотите услышать эти идеи. Вместе с тем у исследовательского подразделения IBM Research есть и благородные идеи: создание нового поколения технологии хранения данных, которая была бы намного более быстрой и менее опасной для окружающей среды; либо создание новых способов считывания информации с физических объектов, таких как мост или водоспуск, где с этим всё обстоит не так просто.
Каждый из исследовательских проектов весьма интересен с перспективы вычислений на компьютере, поскольку они, вероятно, проникнут в ваши дома или офисы в ближайшие десять лет. Каждый проект решает сложную вычислительную проблему, и при этом он ускоряет наступление эры более универсальных вычислений.
Сенсорные сети
Автономный программный пакет Mote Runner, работающий в реальном времени, программируется с помощью языков Java или C#, при этом он может работать со множеством разных аппаратных сенсоров, поскольку все они работают через виртуальную машину. Нажмите на картинку для увеличения.
Сенсорные сети становятся всё популярнее. Они состоят из небольших беспроводных устройств, которые передают измеряемые данные на компьютерную систему. Например, сенсоры могут быть размещены на мосту, при этом они будут сообщать величину транспортного потока, проходящего через мост в любой месяц. В лаборатории IBM в Цюрихе учёные разработали программное обеспечение, которое работает в реальном времени и размещается на самом сенсоре.
Сегодня сенсорные сети имеют гетерогенную природу и работают независимо друг от друга. Каждый новый набор сенсоров использует собственную программную инфраструктуру, то есть не существует какого-либо стандартного набора протоколов, который бы позволял взаимодействовать с другими сенсорными сетями. Программный пакет Mote Runner является одним из решений подобной проблемы, если верить IBM. Поскольку окружение реального времени работает на виртуальной машине, “motes” (или конечные сенсоры) можно повторно использовать для других целей, при этом обеспечивается масштабируемость и независимость от аппаратной составляющей; да и универсальные программные процедуры программировать проще. А поскольку программы независимы от “железа”, их легче разворачивать на сенсорах с разнообразной аппаратной составляющей.
“Mote Runner наилучшим образом использует доступные ресурсы – особенно питание – поскольку требует только 8-битный процессор, 8 кбайт памяти и 128 кбайт флэш-памяти”, говорит доктор Торстен Крамп (Thorsten Kramp), сотрудник исследовательского подразделения IBM Research в Цюрихе. “Среди практических использований этой технологии можно отметить использование водных ресурсов, движение ледников, лесные пожары, строительство и организацию производства, “умные” измерения и повышение эффективности энергопотребления, медицину и здравоохранение, спортивную медицину, уход за больными и мониторинг пациентов”.
Говорим по-английски?
Нажмите на картинку для увеличения.
Совместная работа персонала в системах, подобных WebEx.com, прекрасно оправдывает себя при обсуждении проблем и выработке решений, если только все участники говорят на одном и том же языке. В исследовательской лаборатории IBM в Китае ведётся работа над новым проектом Easy English Communication (простое общение на английском), который поддерживает потоки аудио, видео и текста во время web-конференций, при этом текстовый поток автоматически создаётся с помощью движка распознавания речи.
Распознавание речи очень важно, поскольку это позволяет более точно выполнять перевод в реальном времени. Системы перевода из речи в речь дают слишком много ошибок, причём не только по произношению, но и в самом переводе. В системах распознавания речи в текст IBM величина ошибок составляет около 10%, если оратор использует близко расположенный микрофон по сравнению с величиной ошибок 20% в системах стандартного распознавания речи.
“EEC является альтернативным подходом [к распознаванию речи], использующим преобразование речи в текст в реальном времени, что позволяет лицам, не являющимся носителем языка, лучше понимать собеседника в компьютерных системах связи “, говорит Йонг Квин (Yong Qin), руководитель подразделения распознавания речи IBM Research в Китае.
Storage-Class Memory
Сегодня популярны два способа хранения данных на компьютере, при этом оба имеют свои преимущества. Память NAND, которая применяется в твёрдотельных накопителях (SSD), быстрая и компактная. Поскольку флэш-память использует для хранения данных полупроводники, то SSD больше напоминают память на материнской плате, чем механические жёсткие диски. Однако SSD стоят дорого, да и ёмкости относительно низкие. Винчестеры, которые используют высокоскоростной мотор для доступа к информации, хранящейся на магнитном диске, стоят дешевле, но и производительность при этом оказывается ниже.
Исследовательский центр IBM Almaden разработал память Storage-Class Memory (SCM), гибридный вариант между флэш-памятью и технологией жёсткого диска (по заявлению IBM), в которой твёрдотельные накопители располагаются в массиве, а доступ к ним обеспечивается способом, схожим с магнитным жёстким диском вместо классического чипа флэш-памяти, который можно увидеть, например, в USB-брелоках. Каждый твёрдотельный компонент должен предположительно работать дольше, при этом с большей скоростью, чем обычные магнитные носители.
“Устройство storage-class memory потребует твёрдотельной энергонезависимой памяти, которую можно производить с очень высокой эффективной плотностью, используя комбинацию сублитографических трафаретов, множества бит на ячейку и множества слоёв устройств”, сказал исследователь IBM Джефри Барр (Geoffrey Burr). “Используя SCM в качестве замены жёсткого диска, подсистема хранения сможет дать на порядок лучшую производительность случайного и последовательного ввода/вывода по сравнению со сравнимыми системами на жёстких дисках, при этом SCM будет требовать меньше пространства и энергии в центрах хранения данных. Но успех SCM очень зависит от цены, а также от возможности получения очень высокой плотности хранения – выше, чем у текущей 2-битной памяти NAND с многоуровневыми ячейками – именно на этом и фокусируются наши текущие усилия по исследованию и разработке.”
С помощью Storage-Class Memory массив твёрдотельных накопителей организуется примерно так же, как несколько магнитных пластин друг над другом в жёстком диске (хотя многие модели сегодня используют одну пластину), но доступ осуществляется напрямую, как в полупроводниковом чипе, а не через вращение пластины.
IBM и CyberAgent
Нажмите на картинку для увеличения.
Сервис отслеживания посещаемости блога может сообщать только о том, кто читал вашу страницу. Подобные сервисы дают список того, какие пользователи посещали страницу и какие комментарии они оставляли, но не предоставляют историю активности пользователя и текст, который они написали или прочитали в онлайне. Вместе с японской компанией CyberAgent, исследовательское подразделение IBM в Токио разработало систему мониторинга для службы блогов Ameba в Японии (ameba.jp, более 4,5 млн. пользователей), которая предоставляет всесторонний анализ интересов пользователя, отображающий частоту публикации постов в блоге, просматриваемые области (например, какую часть блога пользователь посетил) и подводит итоговый анализ введённого текста.
С помощью нового движка анализа Ameba можно предлагать пользователям больше блогов, соответствующих их интересам на основе предпочтений просмотра, введённого текста и посещённых ссылок – а не только рекомендации на основе текстового ввода. “Мы надеемся, что мы создали первую в мире платформу, которая может выполнять объединённый комплексный анализ текстовых данных и пользовательской активности “, сказал Акико Мураками (Akiko Murakami), исследователь IBM Research в Токио.
В системе блогов Ameba в Японии новая система позволяет посмотреть не только “клики” мышкой и просмотренные страницы, но и интересы и предпочтения пользователя, что улучшает предложение рекомендаций.
Directed Self-Assembly (DSA)
Нажмите на картинку для увеличения.
Любой знаток вычислительной техники в курсе ограничений эмпирического закона Мура, по которому число транзисторов микропроцессора удваивается каждые 18 месяцев, что заставляет волноваться компании, подобные AMD и Intel. Действительно, сложно увеличивать вычислительную мощность, поскольку размеры транзисторов сегодня так малы, что в одном чипе существуют сотни миллионов транзисторов, и становится всё сложнее увеличивать их количество. Intel изобрела новые способы производства и новые материалы, чтобы уменьшить размер транзистора, но существует потолок (по информации IBM), и мы уже в него упёрлись.
“Исторически компании уменьшали размер транзисторов с помощью технологических достижений, позволяющих инженерам использовать всё меньшую и меньшую длину волны – это очень важный шаг в фотолитографии, где специальный трафарет используется для многоступенчатого процесса формирования интегральных схем”, скалах Билл Хинсберг (Bill Hinsberg), исследователь из центра IBM Almaden. “Изначально интегральные схемы создавались по трафарету с помощью ультрафиолета с длиной волны около 440 нм, а сегодня используется глубокий ультрафиолет от лазерного источника с длиной волны 193 нм. Дальнейшее уменьшение длины волны будет проблематично по техническим причинам, поэтому сегодня изучаются альтернативные способы формирования интегральных схем.”
Именно по этой причине параллельная обработка, когда внутри компьютера работают несколько вычислительных ядер, является наиболее перспективной. IBM также изобрела способ, по которому наночастицы “самостоятельно собираются” и позволяют уместить больше транзисторов на вычислительном ядре, используя технику, когда блок-сополимеры формируют определённую структуру, что невозможно достичь 193-нм фотолитографией. В процессе такой “самостоятельной сборки” молекула полимера, содержащая две секции (их называют блоками), как раз отделяет их друг от друга, формируя нужную структуру, хотя разделяются блоки не полностью.
“При правильных условиях тонкая плёнка из подобных блок-сополимеров может формировать нужные участки из цилиндров, сфер или линий”, говорит Хинсберг. “Размеры этих наноструктур зависят от размеров молекул полимеров, при этом уже были продемонстрированы участки меньше 10 нм. В ходе наших исследований в центре Almaden мы исследуем способы управления формированием структуры, чтобы данный способ был полезен для производства полупроводников, когда более крупные шаблоны будут задавать ориентацию структуры. Данный подход назван “directed self-assembly/прямая самостоятельная сборка”. Наша работа показала, что можно использовать технологию таким образом, чтобы создать большое количество линий наномасштаба из крупного задающего трафарета, и что внутренние свойства блок-сополимеров позволяют “вылечивать” дефекты в задающем трафарете, улучшая качество структуры, что можно назвать важным и полезным атрибутом.”
С помощью технологии прямой самостоятельной сборки молекулы полимеров автоматически разделяются на структуры, но агент химической связи не позволяет им разделиться полностью. В итоге мы получаем наноструктуру, которую можно использовать для создания транзисторов, увеличивающих вычислительную мощность за пределами ограничений текущего фотолитографического процесса.
Watson
Тест на точность и скорость ответа? Совершенно верно: телевизионная передача Jeopardy! Нажмите на картинку для увеличения.
Подобно тестам суперкомпьютеров по игре в шахматы, проведённым несколько лет назад, проект Watson содержит элементы, связанные с мышлением человека. Он призван сделать вычисления более “человечными”. Watson, за которым скрывается система вопросов и ответов, является суперкомпьютерным проектом, в котором компьютер не только решает сложные проблемы, но может их решить так же быстро и точно, как и человек. Для тестирования этого проекта IBM решила выставить суперкомпьютер в качестве полноправного игрока в телевизионной передаче Jeopardy! (аналог в России – “Своя игра”). Тест на самом деле заключался не в том, сможет ли компьютер дать правильный ответ вовремя, а том, будет ли ответ казаться таким, как будто его произнёс человек в виде логической фразы.
“Учёные верят, что компьютерная система сможет понимать сложные вопросы и отвечать с достаточно хорошей точностью и глубиной, чтобы конкурировать в передаче Jeopardy! – в телевизионной игре, которая требует серьёзной эрудиции и быстрого ответа, причём по широкому спектру тем, ” сказала Сара Делекта Галлиган (Sara Delekta Galligan), представитель исследовательского подразделения IBM Research.
Stream Computing (потоковые вычисления)
В потоковых вычислениях данные поступают в приложения для анализа не один раз, а виде непрерывного потока, что позволяет получить более точный результат при изменении оригинального массива данных. Нажмите на картинку для увеличения.
Потоковые вычисления (Stream computing) – один из самых интересных проектов IBM Research, поскольку он может серьёзно повлиять на все сферы вычислений. В традиционном анализе информации вы загружаете массив данных в приложение, которое затем проводит анализ и предоставляет результаты. Чтобы провести повторный анализ, вам нужно изменить данные и повторно запустить тест. В потоковых вычислениях данные поступают в приложение непрерывно, и анализ всегда продолжает выполняться в реальном времени. С точки зрения потребителя это несколько напоминает процесс непрерывной съёмки фотографий с помощью камеры, загрузку их в Photoshop, коррекцию качества картинки, то есть смену фотографий и улучшение их по мере поступления новых кадров – за исключением того, что вы можете снимать один и тот же объект в разное время дня и с разными настройками, а Photoshop выдаст наилучшее изображение с помощью автоматических фильтров и эффектов.
Проблема, которую решают потоковые вычисления, заключается в том, что за время очень долгого запроса к целевому массиву данных, особенно если вам выделили определённый промежуток времени на суперкомпьютере, оригинальные данные могут измениться. То есть учёным приходится работать с устаревшей информацией.
“В программном обеспечении для потоковых вычислений IBM есть уникальная черта – оно использует новую потоковую архитектуру и передовые математические алгоритмы, чтобы выполнить прогнозирующий анализ данных от любого источника, сужая область поиска до нужных результатов и постоянно улучшая ответ по мере поступления новых данных”, сказал Нагуй Халим (Nagui Halim), ведущий учёный в сфере потоковых вычислений в IBM. “Программное обеспечение для потоковых вычислений имеет возможность собирать приложения “на лету”, на основе запроса, на который нужно ответить, используя новую программную архитектуру, задействующую компоненты, которые нужны, когда они нужны, и которые лучше всего подходят для выполнения данного специфического задания”, добавил Халим. “Миллионы фрагментов данных с разных источников поступают в виде потока в системы, которые не способны обработать данные достаточно быстро. Мы создали вычислительную систему для бесконечной аналитики, которая анализирует информацию по мере её поступления – это очень мощное приложение для финансовых услуг, правительственной сферы, астрономии, управления транспортными потоками и многих других научных и бизнес-областей. Мы получаем вычисления в темпе жизни.”
Personal Information Environments (персональные информационные окружения)
Проект Персональных информационных окружений (Personal Information Environment) призван решить проблемы, которые возникают у большинства из нас при ношении множества гаджетов, при использовании множества компьютеров и при входе в множество web-сервисов. Это новая платформа, которая пытается унифицировать разные несопоставимые системы передачи сообщений и компьютеры. В системе существуют центральный сервер PIE и клиент PIE, но они не привязаны к какому-либо устройству. Каждый клиент, который вы используете (ноутбук, смартфон, настольный ПК) работает в качестве клиента для сервера PIE. Реальным преимуществом является то, что вся информация фильтруется через сервер PIE, будь то электронная почта, обновление статуса или сообщение мессенджера через один привычный интерфейс. Также есть служба синхронизации файлов, которая гарантирует, что вы получите доступ к тем же файлам, независимо от используемого устройства, а также функция поиска, которая ищет все персональные данные на сервере.
Ещё один пример работы PIE: если вы создаёте список задач, которые требуется выполнить для вашей работы, то вы можете получить доступ к этому списку с любого устройства. Если вы добавляете в список новый пункт, то сможете получить к нему доступ с другого устройства, то есть вы увидите обновлённый список. По сути, перед нами система коммуникации “в облаке”, которая не привязана к какому-либо конкретному web-сайту, операционной системе или программе.
“Мы знаем, что пользователи задействуют постоянные наборы устройств, и мы поддерживаем эту практику в программном обеспечении, используя протоколы мгновенного обмена информацией, которые облегчают разработчикам построение сервисов для обмена информацией, событиями и командами между устройствами”, сказал Джефф Пиерс (Jeff Pierce), менеджер группы Mobile Computing Research в подразделении IBM Research Almaden.
Концепция PIE заключается в унификации всех коммуникаций на центральном сервере, чтобы информацию можно было искать, получать доступ с любого устройства, а также автоматически синхронизировать данные, чтобы они всегда были актуальными.