вторник, 12 июня 2012 г.

Why the idea of control over audio-content in mobile computers is innovative


The main goal - is to simplify human-computer interaction, bringing it to the level of inter-human communication. This would signify abandoning the approach of turning the user into computer-like creature in favour of making the computer more human-like.
At the end of the eighties a similar breakthrough occurred due to the emergence of a new concept of “user interface”, the most common of which was Microsoft Windows. Through this GUI, millions of users without special training could start using computers, as they began to perceive the computer not as a machine, understanding only special, machine instructions, but as a normal desktop with a number of instruments needed to perform usual human tasks. To date, the development of computers has been moving towards miniaturization, providing mobility and access to the Internet over wireless networks. The main idea is to provide a user with the ability to obtain necessary information at any place and at any time. But the attachment to the visual interface (GUI shells) greatly complicates the human-computer interaction due to the mobile computers’ screen limitations and the need to completely switch all the user's attention to the process of controlling the device. The emergence of a new audio interface will greatly simplify the management of mobile computers, allow the user to do other tasks simultaneously and greatly accelerate the process of providing the person with the information he or she needs. This audio interface must be included in the operating system  of primarily the mobile devices such as PDA, smart phones, and others. For this end, the standards for audio interface must be developed to facilitate its use by other programs and applications.

For a mobile computer user it is easier to receive most of the information as audio-content through headphones. Accordingly, it is more convenient to manage such information through voice commands. Tentatively, such communication with a computer can be referred to as the Question-Answer.Such system would require some new programs, let’s call them audio browser and audio search engine. These programs will allow us to search, organize and play audio files either downloaded from the Internet or stored on your computer without using the screen. Such use will be most effective if the machine is able to understand your question correctly and accurately and quickly select the desired response in the form of an audio file. This requires indexing of audio files’ content. Of course, part of the required labels can be set manually in the form of certain phrases, but for the search to be most accurate a special search engine will have to analyze audio content and set the labels automatically. This approach will not only organize audio files, but will also allow to find desired places within the files, and if necessary to create bookmarks, etc. Such system will also require a number of new applications, such as applications designed to establish the language or the music genre of the audio files.

How should  the audio content look, or rather sound like, then? Will it be formed automatically by means of special programs for creating sound out of text files? Currently, most of the audio content must be created in the recording studios by live people, who ideally, have special training and skills, since intonation plays important role in perception of auditory text. A person does not simply describe events, his intonation shows his attitude towards them. The machine can not yet express the nuances of intonation since it is devoid of emotion. It is a task for the future, perhaps the nearest, but not for today. However it is safe to entrust the machine with reading commands, table of contents, menus, brief newsletters, announcements, letters and short messages.

These additional computer capabilities will greatly simplify the communication between man and machine, expand the number of users and create new programs. They can control the flow of music, provide news programs, artistic, scientific and business literature, tutorials, games and much more. For example, it may be a navigator, which will lead you to a given point, or take you on a certain route and on the way will tell you more about local attractions. But most importantly, the audio interface will make another step towards convergence of man and machine, and this step will be directed towards the person, towards his way of life and it will be in line with his natural predispositions.

суббота, 2 июня 2012 г.

В чем заключается инновационность идеи управления аудио-контентом для мобильных компьютеров?



Основная цель - это упрощение диалога человека с компьютером, доведение его до уровня человеческого общения. Переход на путь, по которому компьютер приближается к человеку, а не наоборот, когда человек все больше начинает походить на компьютер.
В конце восьмидесятых годов прошлого столетия такой прорыв произошел благодаря появлению нового интерфейса в виде «пользовательских оболочек», наиболее распространенная  из которых Microsoft Windows. Благодаря такой графической оболочке миллионы пользователей без особой подготовки смогли начать пользоваться компьютерами, так как они стали воспринимать компьютер не как машину, понимающую только специальные, машинные команды, а как обычный рабочий стол с рядом необходимых для выполнения задач человеческих инструментов. На сегодняшний день развитие компьютеров идет по пути миниатюризации, обеспечивающей  мобильность и возможность  предоставления доступа в сеть интернет по беспроводным сетям.  Основная идея заключается  в возможности пользователю получать необходимую информацию в любом месте и в любое время.  Но привязанность к визуальным  интерфейсам (графическим оболочкам) значительно усложняет диалог человека с компьютером. Это связано и с ограниченными возможностями экрана мобильных компьютеров и с необходимостью полностью переключать все внимание пользователя на процесс управления устройством. Появление нового аудио-интерфейса позволит значительно упростить процесс управления мобильными компьютерами. Даст возможность пользователю заниматься одновременно выполнением других задач, значительно ускорит процесс получения человеком необходимой ему информации. Такой аудио-интерфейс необходимо включить в операционные системы в первую очередь мобильных устройств, таких как PDA, смартфоны и прочие. Для этого необходимо разработать стандарты аудио-интерфейса для дальнейшего его использования другими программами-приложениями.
Для пользователя мобильного компьютера значительную часть информации удобно воспринимать  в виде аудио-контента, которую он мог бы получать через наушники.  Соответственно, управлять такой информацией удобнее будет также голосовыми командами с помощью микрофона. Условно такое общение с компьютером можно назвать Вопрос-Ответ. При этом появляется потребность в ряде новых программ, назовем их аудио-браузер и аудио поисковая машина. Т.е. это программы, позволяющие искать, систематизировать и воспроизводить аудио-файлы из сети интернет или записанные на ваш компьютер, без использования экрана. Такое использование будет максимально эффективным в том случае, если машина сможет правильно понимать ваш вопрос и быстро и точно подбирать нужный вам ответ, т.е. аудио-файл. Возникает необходимость индексации контента т.е. аудио-файлов. Конечно, часть необходимых меток можно установить вручную в виде определенных фраз, но все же поиск будет наиболее точным, если специальная поисковая машина самостоятельно проанализирует контент и установит метки. Такой подход позволит не только систематизировать аудио-файлы, но и находить нужные места в них, при необходимости делать закладки и пр. Потребуется ряд программ, например, таких как определение языка аудио-файла или определение жанра музыкального произведения.
Как должен выглядеть, вернее, звучать, аудио-контент? Будет ли он формироваться автоматически, с помощью специальных программ  формирования звука при считывании текстовых файлов? На сегодняшний день основной объем аудио-контента   должен создаваться в звукозаписывающих студиях, живыми людьми, желательно имеющими специальную подготовку и умение. Дело в том, что при чтении текста интонация играет огромную роль для восприятия. Человек не просто описывает события, а интонацией показывает свое отношение к ним. Машина не может пока выражать свое отношение к читаемому ею тексту, она лишена эмоций, это задача будущего, возможно ближайшего, но не сегодняшних дней. А вот что смело можно поручить читать машине - это команды, оглавления, меню, краткие информационные сводки, анонсы, короткие письма и сообщения.
Такие дополнительные возможности позволят значительно упростить общение человека с машиной, расширить число пользователей, создать новые программы. Это могут  быть управление потоками музыки, новостные программы, художественная, научная и деловая литература, обучающие программы, игры и многое другое. Например, это может быть навигатор, который приведет вас в заданную точку или проведет вас по определенному маршруту и по дороге еще расскажет вам о местных достопримечательностях. Но самое главное, аудио-интерфейс  позволит сделать еще один шаг на пути сближении человека и машины, и этот шаг будет направлен к человеку, к его жизненному укладу в соответствии с его мироощущениями.