Симаргл Опубликовано 1 марта, 2006 Жалоба Поделиться Опубликовано 1 марта, 2006 Известная программа, для автоматического изменения раскладки клавиатуры и замены например RTLH на КЕДР . Каков алгоритм работы программы, или КАК она определяет? Кто-нибудь интересовался этим вопросом? Просветите, хотя бы в общих чертах... Ссылка на комментарий Поделиться на другие сайты Поделиться
Форматцевт Опубликовано 1 марта, 2006 Жалоба Поделиться Опубликовано 1 марта, 2006 Симаргл: всё просто методом частот и сравнения с БД. Ссылка на комментарий Поделиться на другие сайты Поделиться
Симаргл Опубликовано 1 марта, 2006 Автор Жалоба Поделиться Опубликовано 1 марта, 2006 Ну сравнение с базой данных вроде понятно. В БД заложены основные комбинации слов, а вот что-такое "Метод частот"? Ссылка на комментарий Поделиться на другие сайты Поделиться
Shurr Опубликовано 1 марта, 2006 Жалоба Поделиться Опубликовано 1 марта, 2006 Сравниваются не слова, а характерные для языка буквосочетания. Так, например из вариантов "морола" и "vjhjkf" он выберет "морола", т.к. подобное сочетание букв приемлемо для русского языка и неприемлемо для английского. Из вариантов же "ршашлф" и "hifika" будет выбран английский, т.к. сочетания букв более характерны для него. Как конкретно работает PuntoSwitcher неизвестно, но можно предположить. Скорее всего характерным для языка последовательностям букв присваивается определенная оценка. Например для русского языка можно придумать что-нибудь вроде такого: гласная + согласная = 2 согласная + гласная = 2 "др", "пл", "ст" и др. = 1 "оро", "оло", "еле" и др = 3. Дальше можно просуммировать оценки буквосочетаний для слова, и сравнить результаты для каждого языка. У кого больше - тому и водить. Соответственно, чем подробнее словарь - тем более чуствительным получится детектор языка. Как сказал Indomito - можно еще анализировать частоту появления тех или иных символов в слове, что также является индивидуальной характеристикой для каждого языка. Но я бы сказал, что подобный метод применим скорее для анализа более-менее длинных текстов, в которых данная статистика имеет более выраженный характер. PuntoSwitcher же имеет дело с отдельными словами. Ссылка на комментарий Поделиться на другие сайты Поделиться
Симаргл Опубликовано 2 марта, 2006 Автор Жалоба Поделиться Опубликовано 2 марта, 2006 Я примерно так и думал. Спасибо. Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Для публикации сообщений создайте учётную запись или авторизуйтесь
Вы должны быть пользователем, чтобы оставить комментарий
Создать учетную запись
Зарегистрируйте новую учётную запись в нашем сообществе. Это очень просто!
Регистрация нового пользователяВойти
Уже есть аккаунт? Войти в систему.
Войти