UTF-->WIN - HiAsm

Вверх ↑

Форумы КомпонентыUTF-->WIN ← Ctrl12Ctrl →

Этот топик читают: Гость

Ответов: 1891

Рейтинг: 110

#1: 2007-11-11 17:05:02 ЛС | профиль | цитата

Компонента для перекодировки UTF-->WIN(WIN-->UTF)

исправленный вариант ниже

карма: 0

%time%

Ответов: 33

Рейтинг: 0

#2: 2007-11-11 18:38:40 ЛС | профиль | цитата

Alexbootch,
нашел небольшую ошибочку:
после преобразования из UTF в Win, русская буква Р преобразуется как Р(пробел)

поправил твой pas
code_2010.txt

карма: 0

Время верстки: %cr_time% Текущее время: %time%

файлы: 1

code_2010.txt [3.3KB] [951]

Ответов: 1891

Рейтинг: 110

#3: 2007-11-11 20:50:28 ЛС | профиль | цитата

Исправленный вариант Компонента для перекодировки UTF-->WIN(WIN-->UTF)

карма: 0

%time%

Ответов: 4

Рейтинг: 0

#4: 2008-01-17 20:49:26 ЛС | профиль | цитата

А чего размер rar'а =0? Выложите еще раз, пожалуйста, очень нужен компонент

карма: 1

Ответов: 9906

Рейтинг: 351

#5: 2008-01-17 21:20:18 ЛС | профиль | цитата

[svn]Charset.pas[/svn]

карма: 9

Ответов: 4

Рейтинг: 0

#6: 2008-01-18 13:59:55 ЛС | профиль | цитата

Спасибо! Вот еслиб еще из UTF-16 преобразовывало, вообще цены бы небыло!

карма: 1

Ответов: 9906

Рейтинг: 351

#7: 2008-01-18 14:12:33 ЛС | профиль | цитата

Kobra писал(а):

вообще цены бы небыло

У нас другие представления о ключевых параметрах, влияющих на ценность

карма: 9

Разработчик

Ответов: 26355

Рейтинг: 2151

#8: 2008-01-18 14:58:17 ЛС | профиль | цитата

Kobra писал(а):

Вот еслиб еще из UTF-16 преобразовывало

Этот компонент преобразует любую кодовую страницу в любую, надо только знать ихние коды и использовать режим CP1_CP2. Хотя, про UTF-16 сказать ничего не могу.

------------ Дoбавленo:

нашел в инэте -- UTF-16, он же UNICODE, он же UCS2, он же wchar_t широко применяется в сотовой связи для передачи SMS

------------ Дoбавленo:

Я думаю, что надо остановиться на вот этом

Почему же именно UTF-8, а не UTF-16 или UTF-32, так это потому что UTF-8 это единственная из кодировок, обладающая определённой обратной совместимостью

А вот более подробная инфа про UTF-8

UTF-8 (от англ. Unicode Transformation Format — формат преобразования Юникода) — в настоящее время распространенная кодировка, реализующая представление Юникода, совместимое с 8-битным кодированием текста.

Текст, состоящий только из символов с номером меньше 128, при записи в UTF-8 превращается в обычный текст ASCII. И наоборот, в тексте UTF-8 любой байт со значением меньше 128 изображает символ ASCII с тем же кодом. Остальные символы Юникода изображаются последовательностями длиной от 2 до 6 байтов (реально только до 4 байт, поскольку использование кодов больше 221 не планируется), в которых первый байт всегда имеет вид 11xxxxxx, а остальные — 10xxxxxx.

Проще говоря, в формате UTF-8 символы латинского алфавита, знаки препинания и управляющие символы ASCII записываются кодами US-ASCII, a все остальные символы кодируются при помощи октетов со старшим битом 1. В результате, даже если программа не распознаёт Юникод, то латинские буквы, арабские цифры и знаки препинания будут отображаться правильно. Поэтому UTF-8 часто применяется для экономии места на диске в различных компьютерных языках, основанных на английском — обычно английские буквы и знаки препинания занимают существенно больший объём текста, чем строки.

Формат UTF-8 был изобретён 2 сентября 1992 года Кеном Томпсоном и Робом Пайком и реализован в Plan 9[1]. Сейчас стандарт UTF-8 официально закреплён в документах RFC 3629 и ISO/IEC 10646 Annex D.

Вот на нем мы и остановимся, тк он является стандартным, а все будушее оставим будущим поколениям

карма: 23

Ответов: 4

Рейтинг: 0

#9: 2008-01-18 20:17:35 ЛС | профиль | цитата

Хммм.... Мож я что не так понимаю, учусь только. Просто если взять и в тексовом элементе интерфейса выделить текст, написанный кириллицей и вставить его например в Word, то у меня получается абракадабра. Путем изысканий и ломания головы я выяснил, что текст в окне в юникоде или UTF-16, т.е. использует для записи символа 2 байта. Т.е. если к коду символа, допустим, буквы А = 192 прибавить 848, то получится та же буква но в юникоде (справедливо для всех букв кириллицы). Вот как это реализовать попроще? Или я не в том направлении двигаюсь?

карма: 1

Ответов: 9906

Рейтинг: 351

#10: 2008-01-18 20:31:16 ЛС | профиль | цитата

Kobra писал(а):

Просто если взять и в тексовом элементе интерфейса выделить текст, написанный кириллицей и вставить его например в Word, то у меня получается абракадабра

На "русский" переключаться перед копированием -- не пробовал

карма: 9

Гость

Ответов: 17029

Рейтинг: 0

#11: 2008-01-19 12:55:44 правка | ЛС | профиль | цитата

Редактировалось 7 раз(а), последний 2025-02-28 13:05:04

карма: 0

Разработчик

Ответов: 26355

Рейтинг: 2151

#12: 2008-01-19 14:30:34 ЛС | профиль | цитата

Гость писал(а):

и их надо передать в ячейку Excel

А что, UTF-8 для этого никак не подойдет?

карма: 23

Ответов: 9906

Рейтинг: 351

#13: 2008-01-19 15:16:38 ЛС | профиль | цитата

nesco, ты в "угайки" поиграть решил

Ну раскажи тогда значение магической фразы

Гость писал(а):

А если программно формируются строки текста и их надо передать в ячейку Excel

Чтобы не только вам двоим понятно было

карма: 9

Разработчик

Ответов: 26355

Рейтинг: 2151

#14: 2008-01-19 15:27:59 ЛС | профиль | цитата

Galkov писал(а):

ты в "угайки" поиграть решил

Нет, не хочу. Надоели угадайки.

Гость писал(а):

А если программно формируются строки текста и их надо передать в ячейку Excel

А она и так должна нормально туда попасть при отработке скрипта. А если челу очень хочется чего-либо сконвертить? Все Galkov, я пас...

карма: 23

Ответов: 4

Рейтинг: 0

#15: 2008-01-21 05:15:04 ЛС | профиль | цитата

Сорри, если непонятно выражаюсь. Попробую объяснить. После выполения поиска INI файлов имена этих файлов я завожу на компонент INI, который выдает имя секций, найденых в файле, секции у меня написаны по-русски (уж так их формирует стороняя программа), так вот компонент INI и выдает инена секций уже в Unicode (UTF-16). Может можно както его изменить этот компонент или скрипт какой написать?

карма: 1

Форумы КомпонентыUTF-->WIN ← Ctrl12Ctrl →


Сообщение ...
Прикрепленные файлы (файлы не залиты)