XakTalisman,
Этот топик читают: Гость
Ответов: 2059
Рейтинг: 132
|
|||
карма: 6 |
|
Ответов: 1
Рейтинг: 0
|
|||
Уважаемый, flint2, очень заинтересовала тема с омографами. Может ли помочь программа в коррекции ударений в балаболке? Если да, то может кинете ссылочку, ну или название самой проги?
|
|||
карма: 0 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Snil,
Вот ссылка https://yadi.sk/d/H8Utaw69h5LKE Тут словари сделаны под голос Loquendo - Ольга. Под другие голоса надо делать свои словари в связи с тем, что у каждого голоса свои дефекты речи. Малая часть омографов размазана по всем словарям, а не только в самом словаре для омографов - 0mograph2.omn Делалось для Балаболки - мы с ним долго бодались, но он решил оставить свою систему замен. У меня-же, кроме лингвистической обработки омографов в простых словарях обрабатываются даже такие правила: время * *му пошло=время * *му пошло` даже в текстовых редакторах с озвучкой можно запускать обработанный текст. Если не разберёшься, то пиши. Давно это было... Когда то я выкладывал на https://rutracker.org/ мною сделанный голос чтеца Геннадийя Коршунова, но чего то не нашел. На https://mytts.forum2x2.ru/ тоже не нашел, там тоже выкладывал, да и ссылки там давно все битые... (на этих сайтах я под другим ником) Если надо, то Ольга -дистрибутив сохранился https://yadi.sk/d/eHPRYMqwr2Eyy Делал на заре знакомства с Hiasm - по этому такая схема. В схеме применены Win.pas и WinControl.ini от andrestudio, так что в стандартном варианте надо править и ставить HBoxLayout и VBoxLayout. Так как в Hiasm все компоненты для текстового редактора никуда не годятся, то в программе надо указать внешний текстовый редактор во вкладке "Установки", иначе будет ругаться! Сейчас всё можно переделать на компоненте Scintilla ... Сюда я редко захожу, пиши мне в личку на форуме https://gamedev.ru/forum/ там я тоже flint2 Сейчас доделываю нормальный игровой движок специально для HiAsm,- порядка 160 новых компонентов. Когда выложу, буду заходить почаще. Редактировалось 7 раз(а), последний 2020-03-19 23:34:32 |
|||
карма: 6 |
|
Ответов: 56
Рейтинг: 2
|
|||
flint2 писал(а): Сейчас доделываю нормальный игровой движок специально для HiAsm,- порядка 160 новых компонентов. Когда выложу, буду заходить почаще.Здравствуйте. Как у Вас успехи? Очень интересно посмотреть на Ваш игровой движок. Такого реально не хватает в HiAsm. |
|||
карма: 2 |
|
Ответов: 2059
Рейтинг: 132
|
|||
NUB, немного притомился, делать 122 компонента - очень нудно и немного подзабыл паскаль, сейчас всё делаю в C++.
Сейчас, для смены рода деятельности занялся аппаратной генерацией сюжетов: https://forum.hiasm.com/post/306110 Посмотреть движок: https://yadi.sk/d/0v4wEUGlRDXiow Редактировалось 4 раз(а), последний 2020-05-18 11:23:16 |
|||
карма: 6 |
|
Главный модератор
Ответов: 2999
Рейтинг: 396
|
|||
flint2 писал(а): делать 122 компонента - очень нудноflint2 писал(а): занялся аппаратной генерацией сюжетовТогда может быть автогенерацией элементов заниматься? |
|||
карма: 6 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Nic, Такая мысль постоянно бродит в башке!
|
|||
карма: 6 |
|
Ответов: 56
Рейтинг: 2
|
|||
flint2 писал(а): Сейчас, для смены рода деятельности занялся аппаратной генерацией сюжетов: https://forum.hiasm.com/post/306110Посмотреть движок: https://yadi.sk/d/0v4wEUGlRDXiow Вы молодец, такое очень сложно сделать. Мне до этого далеко... --- Добавлено в 2020-05-21 12:28:46 flint2 писал(а): NUB, немного притомился, делать 122 компонента - очень нудно и немного подзабыл паскаль, сейчас всё делаю в C++.Надеюсь, Вы когда-нибудь сделаете игровой движок для HiAsm. Редактировалось 2 раз(а), последний 2020-05-21 12:29:46 |
|||
карма: 2 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Надеюсь, Вы когда-нибудь сделаете игровой движок для HiAsm. Непременно! Просто когда занимаешься чем то одним- глаз замыливается. Когда делаешь паузу и возвращаешься, уже открывается, то чего раньше не замечал. Давайте делать паузы в словах, Произнося и умолкая снова, Чтоб лучше отдавалось в головах Значение вышесказанного слова. Давайте делать паузы в словах. Давайте делать паузы в пути, Смотреть назад внимательно и строго. Чтобы случайно дважды не пройти Одной и той неверною дорогой. Давайте делать паузы в пути. Редактировалось 1 раз(а), последний 2020-05-21 13:45:01 |
|||
карма: 6 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Решал одну задачу по лингвистике и получил побочный эффект. компонент для проверки орфографии: https://yadi.sk/d/33RSSpZnEOiQCA
Пусть безумная идея — Вы не рубайте сгоряча. Вызывайте нас скорее Через гада главврача! С уваженьем... Дата. Подпись. Отвечайте нам, а то, Если вы не отзовётесь, Мы напишем... в "Спортлото"! А хорошо бы в придачу к своей программе иметь (пусть даже простейший) контроль орфографии. Ведь так нередки в текстах АшиПки и оЧеПЯтки... Разумеется, можно подключаться к MS Word средствами OLE Automation. Уж в Ворде-то проверка орфографии реализована, так пусть он и делает всю работу за нас. Правда, возникнут сложности с разными версиями Ворда. Да и странно это - превращать изящную в своей компактности программу в заурядный придаток при некоем монстре. Есть ли другие пути? Одна идея, словно призрак коммунизма, бродит среди лингвистически настроенных умов, начиная с середины прошлого века. Суть гениального (не знаю, нужны ли в этом слове кавычки) озарения такова. Количество 2-буквенных сочетаний в русском алфавите: 33 x 33 = 1089. А допустимых из них: раз-два и обчелся. Можете самостоятельно составить квадратную табличку и вписать в нее все "разрешенные" комбинации. Простейший алгоритм, считай, готов. Безумие этой идеи в том, что минимальный набор проверочных комбинаций охватывает все потенциально возможные слова русского языка! Становится ненужным огромный словарь-тезаурс, где каждое слово надо указывать во всех падежах, наклонениях, спряжениях и т.п. (Ведь даже тезаурус системы Ispell на 850 тыс. словоформ, на практике оказывается не вполне достаточным). Но... (спускаясь с небес на землю), мы скоро заметим, что из 2-буквенных комбинаций можно понаделать еще больше невозможных, несуществующих слов. Все они, естественно, были бы при проверке признаны "правильными". Глокая куздра штеко будланула бокра и курдячит бокренка - здесь только допустимые пары букв! Очевидно, необходимо ужесточить схему, проверяя на допустимость не 2-х буквенные, а 3-буквенные сочетания. Тогда для составления проверочного списка придется прошерстить уже 33 x 33 x 33 = 35937 троек в поисках правильных. Еще более надежным решением будет проверка "четырок". Например, в слове "демагог" - четыре четырки: дема/емаг/маго/агог. Все они - допустимые. Из общего числа в 1185921 - таких найдется тысяч 35-40. Проверяя все четырки заданного слова на допустимость, делаем вывод о верном или неверном его написании. Все упомянутые в Интернета изыски по бессловарной проверке орфографии на этом исчерпываются. Поразмыслив, можно найти примеры, когда и такая схема слишком уж всеобъемлюща. Блинны. Это слово не опознается, как ошибочное, т.к. 4-ка линн - допустимая. (Длинный). Песьмо - из той же оперы - песь - спесь - песьими. Надо что-то делать... Попробуем перейти к проверке 5-ти буквенных сочетаний. Весело, дружно, хватаем бревнышко и несем... Что нам стоит среди 39135399 (39 миллионов с хвостиком) вариантов отыскать "правильные пятерки"? Скрипт на языке Python (в арживе), за считанные минуты решает эту задачу. Набирите командную строку: python orfo.py bigtext.txt ignore.txt и через несколько минут получите требуемый список "пятерок". Я составлял "большой текст" по частям, "склеивая" из отдельных файлов. В одном из них потребовалось удалить все знаки переноса. В итоговый bigtext.txt, размером 15 Мб, вошло с дюжину романов. Названий не привожу, произведения отбирались не по величию авторов, а по величине текста. Так быстрее получался должный объем "словесного материала". Разумеется, я пытался придерживаться принципа "общехудожественности". Никаких физико-математико-философских работ с заумно-языколомной терминологией! Литературные произведения только вменяемых авторов... Мы же собираемся проверять орфографию русского языка. Каждая очередная порция текста добавляла все меньше и меньше нового. Вдалеке просматривается некий предел? Пополнять bigtext.txt новыми шедеврами мне надоело, да и обработка его скриптом стала занимать аж целых 3 минуты - что же будет дальше? Решил пойти на хитрость. Нашел в Интернете частотный словарь русского языка на 69307 наиболее употребительных словоформ и скормил скрипту. Вышло, круглым счетом, 60 тыс. пятерок - так сказать, необходимый минимум. Добавил сей чудный словарь в bigtext.txt... На выходе - 103 тыс. - прирост совсем уже невеликий. ...... Я бы больше расписал, но к сожалению посты ограничены по размеру. Короче говоря, слова с буковкой "Ё" будут считаться с ошибкой? потому что мало таких текстов для обучения - практически нет. Кому интересно,то в следующих постах распишу остальные тонкости и Вы можете делать n-банки по своему разумению и своим хотелкам. Редактировалось 2 раз(а), последний 2020-05-30 14:25:21 |
|||
карма: 6 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Обновление компонента ORFO.
Теперь корректно проверяются тексты с буквой 'Ё'. Для работы с RichEdit надо раскомментировать строку 232 // if ( C^ in [#10] ) then inc(return); // для RichEdit. Для нормальных редакторов строка должна быть закомментирована, как сейчас. Обновление компонента Scintilla. Сделана гибкая и удобная работа с маркерами. Исправлены ошибки. Пример работы совместно двух компонентов в архиве Orfo. https://yadi.sk/d/33RSSpZnEOiQCA https://yadi.sk/d/ZJag_PY2YKqcgA P.S. Правильно я понимаю, что тема никому не интересна? Редактировалось 6 раз(а), последний 2020-06-01 01:30:12 |
|||
карма: 6 |
|
Ответов: 56
Рейтинг: 0
|
|||
flint2 писал(а): P.S. Правильно я понимаю, что тема никому не интересна?Мне, например, интересна, но у меня знания в области лингвистики на начальном уровне. понимания Какие книги можно рассмотреть к рекомендуемому прочтению? (b-ok.cc неплохой библиотечный ресурс по электронным книгам, но есть аккаунт на сайте twirpx.com/twirpx.org) P.S. Интересно, что статей по Hiasm и его применённости для разных задач на том же Хабр нет. Редактировалось 2 раз(а), последний 2020-06-01 09:02:01 |
|||
карма: 0 |
|
Главный модератор
Ответов: 2999
Рейтинг: 396
|
|||
flint2 писал(а): Промолчу. Анекдот Три степени опьянения мужика: 1-я. Достал, поссал, забыл стряхнуть; 2-я. Достал, стряхнул, забыл поссать; 3-я. Поссал, забыл достать; 1-я. Вау! Почему никто не знает об этой прекрасной программе; 2-я. Почему в палитре нет такого нужного (именно мне) элемента? 3-я. Эта программа годится только для...(тут могут быть варианты); Редактировалось 2 раз(а), последний 2020-06-01 13:01:43 |
|||
карма: 6 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Nic,
|
|||
карма: 6 |
|