Компонента для перекодировки UTF-->WIN(WIN-->UTF)
исправленный вариант ниже
Этот топик читают: Гость
Ответов: 1891
Рейтинг: 110
|
|||
карма: 0 |
|
Ответов: 33
Рейтинг: 0
|
|||
Alexbootch,
нашел небольшую ошибочку: после преобразования из UTF в Win, русская буква Р преобразуется как Р(пробел) поправил твой pas code_2010.txt |
|||
карма: 0 |
| ||
файлы: 1 | code_2010.txt [3.3KB] [662] |
Ответов: 1891
Рейтинг: 110
|
|||
Исправленный вариант Компонента для перекодировки UTF-->WIN(WIN-->UTF)
|
|||
карма: 0 |
|
Ответов: 4
Рейтинг: 0
|
|||
А чего размер rar'а =0? Выложите еще раз, пожалуйста, очень нужен компонент
|
|||
карма: 1 |
|
Ответов: 9906
Рейтинг: 351
|
|||
[svn]Charset.pas[/svn]
|
|||
карма: 9 |
|
Ответов: 4
Рейтинг: 0
|
|||
Спасибо! Вот еслиб еще из UTF-16 преобразовывало, вообще цены бы небыло!
|
|||
карма: 1 |
|
Ответов: 9906
Рейтинг: 351
|
|||
Kobra писал(а): вообще цены бы небылоУ нас другие представления о ключевых параметрах, влияющих на ценность |
|||
карма: 9 |
|
Разработчик
Ответов: 26170
Рейтинг: 2127
|
|||
Kobra писал(а): Вот еслиб еще из UTF-16 преобразовывало------------ Дoбавленo: нашел в инэте -- UTF-16, он же UNICODE, он же UCS2, он же wchar_t широко применяется в сотовой связи для передачи SMS ------------ Дoбавленo: Я думаю, что надо остановиться на вот этом Почему же именно UTF-8, а не UTF-16 или UTF-32, так это потому что UTF-8 это единственная из кодировок, обладающая определённой обратной совместимостью
А вот более подробная инфа про UTF-8 UTF-8 (от англ. Unicode Transformation Format — формат преобразования Юникода) — в настоящее время распространенная кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста.
Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байтов (реально только до 4 байт, поскольку использование кодов больше 221 не планируется), в которых первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx. Проще говоря, в формате UTF-8 символы латинского алфавита, знаки препинания и управляющие символы ASCII записываются кодами US-ASCII, a все остальные символы кодируются при помощи октетов со старшим битом 1. В результате, даже если программа не распознаёт Юникод, то латинские буквы, арабские цифры и знаки препинания будут отображаться правильно. Поэтому UTF-8 часто применяется для экономии места на диске в различных компьютерных языках, основанных на английском — обычно английские буквы и знаки препинания занимают существенно больший объём текста, чем строки. Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9[1]. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D. Вот на нем мы и остановимся, тк он является стандартным, а все будушее оставим будущим поколениям |
|||
карма: 22 |
|
Ответов: 4
Рейтинг: 0
|
|||
Хммм.... Мож я что не так понимаю, учусь только. Просто если взять и в тексовом элементе интерфейса выделить текст, написанный кириллицей и вставить его например в Word, то у меня получается абракадабра. Путем изысканий и ломания головы я выяснил, что текст в окне в юникоде или UTF-16, т.е. использует для записи символа 2 байта. Т.е. если к коду символа, допустим, буквы А = 192 прибавить 848, то получится та же буква но в юникоде (справедливо для всех букв кириллицы). Вот как это реализовать попроще? Или я не в том направлении двигаюсь?
|
|||
карма: 1 |
|
Ответов: 9906
Рейтинг: 351
|
|||
Kobra писал(а): Просто если взять и в тексовом элементе интерфейса выделить текст, написанный кириллицей и вставить его например в Word, то у меня получается абракадабраНа "русский" переключаться перед копированием -- не пробовал |
|||
карма: 9 |
|
Гость
Ответов: 17029
Рейтинг: 0
|
|||
Редактировалось 6 раз(а), последний 2025-01-17 18:23:14 |
|||
карма: 0 |
|
Разработчик
Ответов: 26170
Рейтинг: 2127
|
|||
Гость писал(а): и их надо передать в ячейку Excel |
|||
карма: 22 |
|
Ответов: 9906
Рейтинг: 351
|
|||
nesco, ты в "угайки" поиграть решил
Ну раскажи тогда значение магической фразы Гость писал(а): А если программно формируются строки текста и их надо передать в ячейку ExcelЧтобы не только вам двоим понятно было |
|||
карма: 9 |
|
Разработчик
Ответов: 26170
Рейтинг: 2127
|
|||
Galkov писал(а): ты в "угайки" поиграть решилГость писал(а): А если программно формируются строки текста и их надо передать в ячейку Excel |
|||
карма: 22 |
|
Ответов: 4
Рейтинг: 0
|
|||
Сорри, если непонятно выражаюсь. Попробую объяснить. После выполения поиска INI файлов имена этих файлов я завожу на компонент INI, который выдает имя секций, найденых в файле, секции у меня написаны по-русски (уж так их формирует стороняя программа), так вот компонент INI и выдает инена секций уже в Unicode (UTF-16). Может можно както его изменить этот компонент или скрипт какой написать?
|
|||
карма: 1 |
|