каждому существующему слову 32-х битный пиксель цвета (не, ну можно и 24-х битный, но быстродействие сразу же упадет)
Какая разница 8, или 32 битный цвет.
Мы говорим не о хэшах, а о хэш-таблице, это две большие разницы. По этому о быстродействии речи вообще никакой не может быть! Там ничего не ищется, а просто читается по адесу значение.
Допустим по адресу 004122f4 у нас находится такой цвет 1C3F5D9B. Какому-то слову, или нескольким словам соответствует этот адрес 004122f4. По адресу 004122f8 - следующий цвет-соответствующей слову, словосочетанию. Из входного слова мы сразу получаем адрес и читаем цвет по этому адресу.
То есть мы можем закодировать чуть меньше FFFFFFFF оттенков пикселей.