НазадGoogle создаёт хранилище всех человеческих знаний
Фактохранилище, ковчег всех знаний человечества. Всякая приличная мегакорпорация сегодня так или иначе занимается созданием чего-то подобного. Фактохранилище собирает и объединяет информацию со всех просторов сети в единую базу фактов о мире, а так же людях и предметах. О самом большом хранилище знаний в человеческой истории — том, над которым сейчас работает Google.
Источник http://www.newscientist.com/article/mg22329832.700-googles-factchecking-bots-build-vast-knowledge-bank.html?full=true#.VAeG3td_vh4
Вместо этого Фактохранилище (Хранилище Знаний, Knowledge Vault) собирает и объединяет информацию со всех просторов сети в единую базу фактов о мире, а так же людях и предметах его населяющих.
Размах и скрупулезность подбора этих знаний уже сегодня стали основой систем, которые позволяют роботам и смартфонам понимать, что люди спрашивают у них. Цель — дать возможность Гуглу осмысленно отвечать на вопросы словно древнему оракулу, вместо обычной поисковой машины с ее поисковой строкой, как это происходит сейчас.
Фактохранилище это такой тип «базы знаний», который позволяет не только людям, но и машинам (это важно!) пользоваться ей. Обычная база данных содержит набор букв и чисел, в то время как база знаний содержит факты. Когда ты спрашиваешь у гугла «Где родился Путин?» ответ идет не из базы данных, как таковой, (нет какой–то особой выделенной ячейки в таблице некой БД, где хранится слово «Ленинград»), а именно из базы знаний.
Сегодня подобная база знаний называется Графом Знаний и в основном пополняется за счет краудсорсинга (коллективного сбора данных, вроде википеди). Но стало понятно, что подобная модель стагнирует, человечество выжимает из нее последние соки.
Вот Гугл и решил автоматизировать процесс. Он начал строить Фактохранилище, используя алгоритмы, автоматически вытаскивающие факты из сети, применяя машинное обучение, для превращения потока данных в структурированный набор фактов.
Фактохранилище собрало 1.6 миллиардов данных на текущий момент. Из них 271 миллион считаются «надежными фактами», т.е. фактами, в истинности или хотя бы верности которых алгоритмы гугла уверены как минимум на 90%. Это достигается за счет кросс–ссылок и внутренних перепроверок, основываясь на тех доверительных фактах, что у него уже есть.
Фактохранилище гарантирует Гуглу быстрый и автоматический рост базы фактов, и со временем скорость будет только нарастать. Ведь роботы не только сканируют открытые веб–страницы с текстом, информация собирается так же и с закрытых источников, например анализируя торговые тренды с серверов Амазона и им подобным.
Читать полностью...
Источник http://www.newscientist.com/article/mg22329832.700-googles-factchecking-bots-build-vast-knowledge-bank.html?full=true#.VAeG3td_vh4
Вместо этого Фактохранилище (Хранилище Знаний, Knowledge Vault) собирает и объединяет информацию со всех просторов сети в единую базу фактов о мире, а так же людях и предметах его населяющих.
Размах и скрупулезность подбора этих знаний уже сегодня стали основой систем, которые позволяют роботам и смартфонам понимать, что люди спрашивают у них. Цель — дать возможность Гуглу осмысленно отвечать на вопросы словно древнему оракулу, вместо обычной поисковой машины с ее поисковой строкой, как это происходит сейчас.
Фактохранилище это такой тип «базы знаний», который позволяет не только людям, но и машинам (это важно!) пользоваться ей. Обычная база данных содержит набор букв и чисел, в то время как база знаний содержит факты. Когда ты спрашиваешь у гугла «Где родился Путин?» ответ идет не из базы данных, как таковой, (нет какой–то особой выделенной ячейки в таблице некой БД, где хранится слово «Ленинград»), а именно из базы знаний.
Сегодня подобная база знаний называется Графом Знаний и в основном пополняется за счет краудсорсинга (коллективного сбора данных, вроде википеди). Но стало понятно, что подобная модель стагнирует, человечество выжимает из нее последние соки.
Вот Гугл и решил автоматизировать процесс. Он начал строить Фактохранилище, используя алгоритмы, автоматически вытаскивающие факты из сети, применяя машинное обучение, для превращения потока данных в структурированный набор фактов.
Фактохранилище собрало 1.6 миллиардов данных на текущий момент. Из них 271 миллион считаются «надежными фактами», т.е. фактами, в истинности или хотя бы верности которых алгоритмы гугла уверены как минимум на 90%. Это достигается за счет кросс–ссылок и внутренних перепроверок, основываясь на тех доверительных фактах, что у него уже есть.
Фактохранилище гарантирует Гуглу быстрый и автоматический рост базы фактов, и со временем скорость будет только нарастать. Ведь роботы не только сканируют открытые веб–страницы с текстом, информация собирается так же и с закрытых источников, например анализируя торговые тренды с серверов Амазона и им подобным.
Читать полностью...