Вверх ↑
Этот топик читают: Гость
Ответов: 2059
Рейтинг: 132
#16: 2019-02-22 23:43:56 ЛС | профиль | цитата
https://yadi.sk/d/nNSiSMu-oS5fZg
https://yadi.sk/d/iKeEKG__Nk3QHA
https://yadi.sk/d/-QWZiVPMv7FCUQ
карма: 6

0
Ответов: 1291
Рейтинг: 47
#17: 2019-02-22 23:59:27 ЛС | профиль | цитата
flint2, спасибо. Конечно из пушки, по амебам)) Для Словоцвета достаточно просто списка замены. Хотя если прикрутить компонент нейросети, то возможно будет еще круче. Тогда уже не нужно грамматику учитывать и прочее. Сеть сама вычленит корень слов и выберет нужный цвет.

Редактировалось 1 раз(а), последний 2019-02-23 16:06:39
карма: 3
Hiasm + Flowstone + CopperCube + GoDot + JS
0
Ответов: 2059
Рейтинг: 132
#18: 2019-02-23 00:53:21 ЛС | профиль | цитата
Сеть сама вычленит корень слов и вылерет нужный цвет.

Корни слов ищутся по электронному словарю Зализняка. Он для этого и существует.
Как-то давно выкладывал. У меня точно не осталось.
Вот, что может помочь отцу русской демократии: https://yadi.sk/d/YW7pOk3QpcUgxw Нейросети для других задач.
+ к тому-же, как я понял, понадобится переменное число входов(длина слова-предложения).
Это не простая задача. Надо поискать, как то делал, но не обещаю, много чего безвозвратно погибло у меня.
https://habr.com/ru/company/meanotek/blog/256593/
Но всё равно, замучаешься обучать, если обратной ошибкой, да и другими методами тоже.
Есть правило - Если можно обойтись без сети, - делай без сети!
Результат будет таким: - "Это скорее белое, чем чёрное, с вероятностью N%".
Словоцвета достаточно просто списка замены.

Что надо-то? В тексте надо заменять, или кто?
Можешь на пальцах показать?
P.S.
Кое-чего нашёл. Схемка ищет однокоренные слова, понимает смысл предложения, в следствии чего точно определяет [все-всё, гОры-горЫ, зАмок-замОк, бОльшая-большАя, бОчки-бочкИ...], понимает смысл прочитанного рассказа\книги и делает краткое описание - аннотацию.
Может то, что тебе нужно.
Только надо схемку привести в порядок.
Ты сначала объясни, что нужно, а то я зря буду время тратить.

Редактировалось 8 раз(а), последний 2019-02-23 01:59:08
карма: 6

0
Разработчик
Ответов: 26113
Рейтинг: 2126
#19: 2019-02-23 01:59:42 ЛС | профиль | цитата
flint2 писал(а):
Что надо-то? В тексте надо заменять, или кто?
Можешь на пальцах показать?

Если я правильно понял, то Aziz пытается придумать что-то типа цветового кодека. Это когда слову в тексте сопоставляется какой-то определенный цвет, используя словарь кодировки формата "слово -- цвет". Но тут куча подводных камней. И одно из самых главных -- это быстродействие, тут словари придется бить на несколько по частоте использования и использовать кодирование только кратное 32-м, чтобы исключить сдвиг текста. Второе -- это нерациональное использование кодировки. Преимущество сжатия будет наблюдаться при словах длиннее 4-х символов (при 32-х битном кодировании). А что делать с предлогами и словами ниже 4-х символов???
Короче, до фига геморра с сомнительной пользой.

Редактировалось 4 раз(а), последний 2019-02-23 02:05:55
карма: 22

0
Ответов: 2059
Рейтинг: 132
#20: 2019-02-23 02:13:21 ЛС | профиль | цитата
nesco, Я сразу ему предложил хеш-таблицы.
Там нет понятия быстродействия, там результат моментален.
https://yadi.sk/d/xXAdqFdp3UdRPW
Короче, до фига геморра с сомнительной пользой.

Что-то подобное делал, даже по такой маске [вид у * был *чудной=вид у * был *чудно`й]
На выходе текст под звёздочками автоматом восстанавливается. Тоже на хеш-таблице.
К тексту в 1.5Мб(много слов) применялось 4 словаря ро ~ 800 000 правил. Время обработки ~3-5сек. Время в основном уходит на загрузку таблиц.
Если у него 300-500 слов-словосочитаний, то хеширования, в общем-то и не надо.

То есть надо Так?
серобуромалиновый в крапинку=0x18AEF70C

А как словами яркость передавать?

Редактировалось 7 раз(а), последний 2019-02-23 02:40:38
карма: 6

0
Разработчик
Ответов: 26113
Рейтинг: 2126
#21: 2019-02-23 02:40:23 ЛС | профиль | цитата
flint2 писал(а):
А как словами яркость передавать?

Яркость -- это оттенок цвета, а цвету соответствует какое-то слово из словаря, точнее пикселю цвета. Короче, текст превращается в цветную картинку. По понятийному содержанию эта картинка будет ХЗ на что похожа -- цветовая абракадабра, КМК.
flint2 писал(а):
То есть надо Так?
серобуромалиновый в крапинку=0x18AEF70C

У тебя три текстовых слова и два пробела (28 символов, я посчитал), значит это будет соответствовать пяти 32-х битным пикселям, те 20-ти ASCII символам в памяти. Ну и сколько мы тут наэкономили?

Редактировалось 3 раз(а), последний 2019-02-23 02:49:09
карма: 22

0
Ответов: 2059
Рейтинг: 132
#22: 2019-02-23 02:43:37 ЛС | профиль | цитата
Странно всё это!
Пусть сам растолкует.
Я примерно понимаю тебя, но у меня, чего-то в башке это всё ровно не ложится.

Редактировалось 1 раз(а), последний 2019-02-23 02:43:56
карма: 6

0
Разработчик
Ответов: 26113
Рейтинг: 2126
#23: 2019-02-23 02:46:52 ЛС | профиль | цитата
flint2 писал(а):
Я примерно понимаю тебя, но у меня, чего=то в башке это всё ровно не ложится.

Прочитай еще раз мой пост, я там кое-чего добавил, может поймешь лучше?
карма: 22

0
Ответов: 2059
Рейтинг: 132
#24: 2019-02-23 02:57:19 ЛС | профиль | цитата
nesco писал(а):
Ну и сколько мы тут наэкономили?

Экономия тут ни причём.
Хеш-сумма является адресом второй половинки правила.
Нет ни какой разницы, буква-ли это, или целое предложение.
Просто входная стока пересчитывается в ключ - он-же адрес.
Чтобы не было повторений, всё строится по простым числам. В смысле - математическое простое число.
Может он хочет представить текст книжки в цветных пятнах.
Однокоренные слова будут иметь определённый оттенок.

Редактировалось 3 раз(а), последний 2019-02-23 03:10:11
карма: 6

0
Разработчик
Ответов: 26113
Рейтинг: 2126
#25: 2019-02-23 03:18:18 ЛС | профиль | цитата
flint2 писал(а):
Может он хочет представить текст книжки в цветных пятнах.
Однокоренные слова будут иметь определённый оттенок.

Причем тут хэши, цветовые пятна и однокоренные слова? Неужели так трудно понять, что чел хочет присвоить каждому существующему слову 32-х битный пиксель цвета (не, ну можно и 24-х битный, но быстродействие сразу же упадет), после чего текст тупо превратится в картинку bmp.

--- Добавлено в 2019-02-23 03:25:41

Но что-то подобное я уже где-то видел. ЕМНИП, то так вклеивали шифрованный текст в картинки. Если применить избыточное кодирование Рида-Соломона, то пихать этот текст можно не только в bmp.

Редактировалось 2 раз(а), последний 2019-02-23 03:28:03
карма: 22

0
Ответов: 2059
Рейтинг: 132
#26: 2019-02-23 03:53:02 ЛС | профиль | цитата
Это я понял.
каждому существующему слову 32-х битный пиксель цвета (не, ну можно и 24-х битный, но быстродействие сразу же упадет)

Какая разница 8, или 32 битный цвет.
Мы говорим не о хэшах, а о хэш-таблице, это две большие разницы. По этому о быстродействии речи вообще никакой не может быть! Там ничего не ищется, а просто читается по адесу значение.
Допустим по адресу 004122f4 у нас находится такой цвет 1C3F5D9B. Какому-то слову, или нескольким словам соответствует этот адрес 004122f4. По адресу 004122f8 - следующий цвет-соответствующей слову, словосочетанию. Из входного слова мы сразу получаем адрес и читаем цвет по этому адресу.
То есть мы можем закодировать чуть меньше FFFFFFFF оттенков пикселей.
карма: 6

0
Ответов: 537
Рейтинг: 14
#27: 2019-02-23 03:53:14 ЛС | профиль | цитата
Вот опять главные динаят flint2 -
nesco,flint2 напишите мне в ЛС зачем ругаетесь за эти компонененты
карма: 4

0
Ответов: 2059
Рейтинг: 132
#28: 2019-02-23 04:00:24 ЛС | профиль | цитата
Sersey, Мы не ругаемся, мы рассуждаем.
Уже поздно, завтра поговорим, если будет состояние стояния, то есть обратное состоянию не стояния, иначе застенчивость. Сегодня с холодильником уматался, вернее с двумя. Один выбросил, второй купил.
карма: 6

0
Ответов: 537
Рейтинг: 14
#29: 2019-02-23 04:00:26 ЛС | профиль | цитата
Про лингвистику компоненты, поверял, все работает, этот компонент можно для многого использовать. Например можно оценки небольшим стихам ставить. По формуле рассчитать и все
карма: 4

0
Разработчик
Ответов: 26113
Рейтинг: 2126
#30: 2019-02-23 04:04:32 ЛС | профиль | цитата
flint2 писал(а):
Какая разница 8, или 32 битный цвет.
Мы говорим не о хэшах, а о хэш-таблице, это две большие разницы. По этому о быстродействии речи вообще никакой не может быть! Там ничего не ищется, а просто читается по адесу значение.
Допустим по адресу 004122f4 у нас находится такой цвет 1C3F5D9B. Какому-то слову, или нескольким словам соответствует этот адрес 004122f4. По адресу 004122f8 - следующий цвет-соответствующей слову, словосочетанию. Из входного слова мы сразу получаем адрес и читаем цвет по этому адресу.
То есть мы можем закодировать чуть меньше FFFFFFFF оттенков пикселей.

А зачем двойное преобразование "слово -- адрес -- цвет", почему нельзя сразу "слово -- цвет"? Тут я немного не догнал -- ты получаешь хэш-сумму слова (словосочетания), это и есть твой адрес, по которому ты выбираешь цвет из таблицы? Пардон, а как происходит обратное декодирование, хэш-сумма же не дешифруется, это же одностороннее кодирование, или тоже через таблицу?

Редактировалось 2 раз(а), последний 2019-02-23 04:10:16
карма: 22

0
Сообщение
...
Прикрепленные файлы
(файлы не залиты)