https://yadi.sk/d/nNSiSMu-oS5fZg
https://yadi.sk/d/iKeEKG__Nk3QHA
https://yadi.sk/d/-QWZiVPMv7FCUQ
Этот топик читают: Гость
Ответов: 2059
Рейтинг: 132
|
|||
карма: 6 |
|
Ответов: 1291
Рейтинг: 47
|
|||
flint2, спасибо. Конечно из пушки, по амебам)) Для Словоцвета достаточно просто списка замены. Хотя если прикрутить компонент нейросети, то возможно будет еще круче. Тогда уже не нужно грамматику учитывать и прочее. Сеть сама вычленит корень слов и выберет нужный цвет.
Редактировалось 1 раз(а), последний 2019-02-23 16:06:39 |
|||
карма: 3 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Сеть сама вычленит корень слов и вылерет нужный цвет. Корни слов ищутся по электронному словарю Зализняка. Он для этого и существует. Как-то давно выкладывал. У меня точно не осталось. Вот, что может помочь отцу русской демократии: https://yadi.sk/d/YW7pOk3QpcUgxw Нейросети для других задач. + к тому-же, как я понял, понадобится переменное число входов(длина слова-предложения). Это не простая задача. Надо поискать, как то делал, но не обещаю, много чего безвозвратно погибло у меня. https://habr.com/ru/company/meanotek/blog/256593/ Но всё равно, замучаешься обучать, если обратной ошибкой, да и другими методами тоже. Есть правило - Если можно обойтись без сети, - делай без сети! Результат будет таким: - "Это скорее белое, чем чёрное, с вероятностью N%". Словоцвета достаточно просто списка замены. Что надо-то? В тексте надо заменять, или кто? Можешь на пальцах показать? P.S. Кое-чего нашёл. Схемка ищет однокоренные слова, понимает смысл предложения, в следствии чего точно определяет [все-всё, гОры-горЫ, зАмок-замОк, бОльшая-большАя, бОчки-бочкИ...], понимает смысл прочитанного рассказа\книги и делает краткое описание - аннотацию. Может то, что тебе нужно. Только надо схемку привести в порядок. Ты сначала объясни, что нужно, а то я зря буду время тратить. Редактировалось 8 раз(а), последний 2019-02-23 01:59:08 |
|||
карма: 6 |
|
Разработчик
Ответов: 26113
Рейтинг: 2126
|
|||
flint2 писал(а): Что надо-то? В тексте надо заменять, или кто?Можешь на пальцах показать? Если я правильно понял, то Aziz пытается придумать что-то типа цветового кодека. Это когда слову в тексте сопоставляется какой-то определенный цвет, используя словарь кодировки формата "слово -- цвет". Но тут куча подводных камней. И одно из самых главных -- это быстродействие, тут словари придется бить на несколько по частоте использования и использовать кодирование только кратное 32-м, чтобы исключить сдвиг текста. Второе -- это нерациональное использование кодировки. Преимущество сжатия будет наблюдаться при словах длиннее 4-х символов (при 32-х битном кодировании). А что делать с предлогами и словами ниже 4-х символов??? Короче, до фига геморра с сомнительной пользой. Редактировалось 4 раз(а), последний 2019-02-23 02:05:55 |
|||
карма: 22 |
|
Ответов: 2059
Рейтинг: 132
|
|||
nesco, Я сразу ему предложил хеш-таблицы.
Там нет понятия быстродействия, там результат моментален. https://yadi.sk/d/xXAdqFdp3UdRPW Короче, до фига геморра с сомнительной пользой. Что-то подобное делал, даже по такой маске [вид у * был *чудной=вид у * был *чудно`й] На выходе текст под звёздочками автоматом восстанавливается. Тоже на хеш-таблице. К тексту в 1.5Мб(много слов) применялось 4 словаря ро ~ 800 000 правил. Время обработки ~3-5сек. Время в основном уходит на загрузку таблиц. Если у него 300-500 слов-словосочитаний, то хеширования, в общем-то и не надо. То есть надо Так? серобуромалиновый в крапинку=0x18AEF70C А как словами яркость передавать? Редактировалось 7 раз(а), последний 2019-02-23 02:40:38 |
|||
карма: 6 |
|
Разработчик
Ответов: 26113
Рейтинг: 2126
|
|||
flint2 писал(а): А как словами яркость передавать?Яркость -- это оттенок цвета, а цвету соответствует какое-то слово из словаря, точнее пикселю цвета. Короче, текст превращается в цветную картинку. По понятийному содержанию эта картинка будет ХЗ на что похожа -- цветовая абракадабра, КМК. flint2 писал(а): То есть надо Так?серобуромалиновый в крапинку=0x18AEF70C У тебя три текстовых слова и два пробела (28 символов, я посчитал), значит это будет соответствовать пяти 32-х битным пикселям, те 20-ти ASCII символам в памяти. Ну и сколько мы тут наэкономили? Редактировалось 3 раз(а), последний 2019-02-23 02:49:09 |
|||
карма: 22 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Странно всё это!
Пусть сам растолкует. Я примерно понимаю тебя, но у меня, чего-то в башке это всё ровно не ложится. Редактировалось 1 раз(а), последний 2019-02-23 02:43:56 |
|||
карма: 6 |
|
Разработчик
Ответов: 26113
Рейтинг: 2126
|
|||
flint2 писал(а): Я примерно понимаю тебя, но у меня, чего=то в башке это всё ровно не ложится.Прочитай еще раз мой пост, я там кое-чего добавил, может поймешь лучше? |
|||
карма: 22 |
|
Ответов: 2059
Рейтинг: 132
|
|||
nesco писал(а): Ну и сколько мы тут наэкономили?Экономия тут ни причём. Хеш-сумма является адресом второй половинки правила. Нет ни какой разницы, буква-ли это, или целое предложение. Просто входная стока пересчитывается в ключ - он-же адрес. Чтобы не было повторений, всё строится по простым числам. В смысле - математическое простое число. Может он хочет представить текст книжки в цветных пятнах. Однокоренные слова будут иметь определённый оттенок. Редактировалось 3 раз(а), последний 2019-02-23 03:10:11 |
|||
карма: 6 |
|
Разработчик
Ответов: 26113
Рейтинг: 2126
|
|||
flint2 писал(а): Может он хочет представить текст книжки в цветных пятнах.Однокоренные слова будут иметь определённый оттенок. Причем тут хэши, цветовые пятна и однокоренные слова? Неужели так трудно понять, что чел хочет присвоить каждому существующему слову 32-х битный пиксель цвета (не, ну можно и 24-х битный, но быстродействие сразу же упадет), после чего текст тупо превратится в картинку bmp. --- Добавлено в 2019-02-23 03:25:41 Но что-то подобное я уже где-то видел. ЕМНИП, то так вклеивали шифрованный текст в картинки. Если применить избыточное кодирование Рида-Соломона, то пихать этот текст можно не только в bmp. Редактировалось 2 раз(а), последний 2019-02-23 03:28:03 |
|||
карма: 22 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Это я понял.
каждому существующему слову 32-х битный пиксель цвета (не, ну можно и 24-х битный, но быстродействие сразу же упадет)
Какая разница 8, или 32 битный цвет. Мы говорим не о хэшах, а о хэш-таблице, это две большие разницы. По этому о быстродействии речи вообще никакой не может быть! Там ничего не ищется, а просто читается по адесу значение. Допустим по адресу 004122f4 у нас находится такой цвет 1C3F5D9B. Какому-то слову, или нескольким словам соответствует этот адрес 004122f4. По адресу 004122f8 - следующий цвет-соответствующей слову, словосочетанию. Из входного слова мы сразу получаем адрес и читаем цвет по этому адресу. То есть мы можем закодировать чуть меньше FFFFFFFF оттенков пикселей. |
|||
карма: 6 |
|
Ответов: 537
Рейтинг: 14
|
|||
Вот опять главные динаят flint2 -
nesco,flint2 напишите мне в ЛС зачем ругаетесь за эти компонененты |
|||
карма: 4 |
|
Ответов: 2059
Рейтинг: 132
|
|||
Sersey, Мы не ругаемся, мы рассуждаем.
Уже поздно, завтра поговорим, если будет состояние стояния, то есть обратное состоянию не стояния, иначе застенчивость. Сегодня с холодильником уматался, вернее с двумя. Один выбросил, второй купил. |
|||
карма: 6 |
|
Ответов: 537
Рейтинг: 14
|
|||
Про лингвистику компоненты, поверял, все работает, этот компонент можно для многого использовать. Например можно оценки небольшим стихам ставить. По формуле рассчитать и все
|
|||
карма: 4 |
|
Разработчик
Ответов: 26113
Рейтинг: 2126
|
|||
flint2 писал(а): Какая разница 8, или 32 битный цвет. Мы говорим не о хэшах, а о хэш-таблице, это две большие разницы. По этому о быстродействии речи вообще никакой не может быть! Там ничего не ищется, а просто читается по адесу значение. Допустим по адресу 004122f4 у нас находится такой цвет 1C3F5D9B. Какому-то слову, или нескольким словам соответствует этот адрес 004122f4. По адресу 004122f8 - следующий цвет-соответствующей слову, словосочетанию. Из входного слова мы сразу получаем адрес и читаем цвет по этому адресу. То есть мы можем закодировать чуть меньше FFFFFFFF оттенков пикселей. А зачем двойное преобразование "слово -- адрес -- цвет", почему нельзя сразу "слово -- цвет"? Тут я немного не догнал -- ты получаешь хэш-сумму слова (словосочетания), это и есть твой адрес, по которому ты выбираешь цвет из таблицы? Пардон, а как происходит обратное декодирование, хэш-сумма же не дешифруется, это же одностороннее кодирование, или тоже через таблицу? Редактировалось 2 раз(а), последний 2019-02-23 04:10:16 |
|||
карма: 22 |
|