Вверх ↑
Этот топик читают: Гость
Разработчик
Ответов: 26305
Рейтинг: 2146
#16: 2010-11-14 02:57:07 ЛС | профиль | цитата
Laetar писал(а):
Латиница-1 дополнительная

Ну да, это она и есть -- C2 80 — C3 BF
А ему нужна -- D0 80 — D3 BF
с учетом Базовой латиницы -- 00 — 7F

------------ Дoбавленo в 03.27:
Можно найти смещение и сделать свой декодер.

дамп файла, который надо преобразовать


00000000: EF BB BF C3 A0 C3 A1 C3|A2 C3 A3 C3 A4 C3 A5 C3 | àáâãäåГ
00000010: A6 C3 A7 C3 A8 C3 A9 C3|AA C3 AB C3 AC C3 AD C3 | ¦Г§ГЁГ©ГЄГ«Г¬Г­Г
00000020: AE C3 AF C3 B0 C3 B1 C3|B2 C3 B3 C3 B4 C3 B5 C3 | ®ГЇГ°Г±ГІГіГґГµГ
00000030: B6 C3 B7 C3 B8 C3 B9 C3|BC C3 BB C3 BA C3 BD C3 | ¶Г·ГёГ№ГјГ»ГєГЅГ
00000040: BE C3 BF C3 80 C3 81 C3|82 C3 83 C3 84 C3 85 C3 | ѕГїГЂГЃГ‚ÃÄÅГ
00000050: 86 C3 87 C3 88 C3 89 C3|8A C3 8B C3 8C C3 8D C3 | †Г‡Г€Г‰ГЉГ‹ГЊГЌГ
00000060: 8E C3 8F C3 90 C3 91 C3|92 C3 93 C3 94 C3 95 C3 | ЋГЏГђГ‘ÒÓÔÕГ
00000070: 96 C3 97 C3 9C C3 9B C3|9A C3 9D C3 9E C3 9F | –×ÜÛÚÝÞß

дамп файла, который надо получить


00000000: EF BB BF D0 B0 D0 B1 D0|B2 D0 B3 D0 B4 D0 B5 D0 | абвгдеР
00000010: B6 D0 B7 D0 B8 D0 B9 D0|BA D0 BB D0 BC D0 BD D0 | ¶Р·РёР№РєР»РјРЅР
00000020: BE D0 BF D1 80 D1 81 D1|82 D1 83 D1 84 D1 85 D1 | ѕРїСЂСЃС‚уфхС
00000030: 86 D1 87 D1 88 D1 89 D1|8C D1 8B D1 8A D1 8D D1 | †С‡С€С‰СЊС‹СЉСЌС
00000040: 8E D1 8F D0 90 D0 91 D0|92 D0 93 D0 94 D0 95 D0 | ЋСЏРђР‘ВГДЕР
00000050: 96 D0 97 D0 98 D0 99 D0|9A D0 9B D0 9C D0 9D D0 | –ЗИЙКЛМНР
00000060: 9E D0 9F D0 A0 D0 A1 D0|A2 D0 A3 D0 A4 D0 A5 D0 | ћРџР РЎРўРЈР¤РҐР
00000070: A6 D0 A7 D0 AC D0 AB D0|AA D0 AD D0 AE D0 AF | ¦Р§Р¬Р«РЄР­Р®РЇ

Первые три байта, это -- BOM, идентификатор UTF-8
карма: 22

0
Ответов: 1379
Рейтинг: 86
#17: 2010-11-14 12:08:17 ЛС | профиль | цитата
Я сейчас скопировал текст из файла с кракозябрами на тот сервис определения. Выбрал в "Текст выглядит как" первое. Получилось как у Laetar'a.
Пришел к выводу, что нужно сконвертировать iso8859-1 в windows1251
Но как.. Пойду гуглить в яндексе.
карма: 0

0
Разработчик
Ответов: 26305
Рейтинг: 2146
#18: 2010-11-14 12:15:31 ЛС | профиль | цитата
petrocan, ты читать умеешь
nesco писал(а):
У меня отображается как
исходная кодировка: Windows-1251
отображается как: Windows-1252

Но там -- ни то и не другое. Там
Laetar писал(а):
Латиница-1 дополнительная

в UTF-8. Вот этот UTF-8 в латинице, надо перевест в кириллический UTF-8
карма: 22

0
Ответов: 1379
Рейтинг: 86
#19: 2010-11-14 12:21:49 ЛС | профиль | цитата
nesco, читать может и умею, но вот понять..
nesco писал(а):
Там Латиница-1 дополнительная в UTF-8. Вот этот UTF-8 в латинице, надо перевест в кириллический UTF-8

Ясно.
карма: 0

0
Разработчик
Ответов: 26305
Рейтинг: 2146
#20: 2010-11-14 12:22:25 ЛС | профиль | цитата
Вот сохраненный файл log.zip, открой его обычным HEX дампером и посмотри на кодировку кракозябр

00000000: 5B 7B 22 69 64 22 3A 22|35 37 35 30 22 2C 22 76 | [{"id":"5750","v
00000010: 61 6C 75 65 22 3A 22 32|30 31 30 2D 31 31 2D 31 | alue":"2010-11-1
00000020: 34 20 30 32 3A 34 33 3A|31 34 20 5B 49 4E 46 4F | 4 02:43:14 [INFO
00000030: 5D 20 3C 33 41 42 58 4F|33 3E 20 C3 AE C3 AA 29 | ] <3ABXO3> îê)

Ты видишь, а что я тебе писал в последнем посту
nesco писал(а):

Laetar писал(а):
Латиница-1 дополнительная

Ну да, это она и есть -- C2 80 — C3 BF



карма: 22

0
файлы: 1log.zip [1.7KB] [94]
Ответов: 1379
Рейтинг: 86
#21: 2010-11-14 12:33:45 ЛС | профиль | цитата
nesco, я понял что это utf8 латиница-1 дополнительная
Пока ничего не нашел.
------------ Дoбавленo в 13.04:
И про hex-дампер. Я не понял что это и где искать
карма: 0

0
Разработчик
Ответов: 26305
Рейтинг: 2146
#22: 2010-11-14 12:35:59 ЛС | профиль | цитата
petrocan писал(а):
И про hex-дампер. Я не понял что это и где искать

http://www.hiasm.com/sha/shatools.php?q=5&id=194
карма: 22

0
Ответов: 1379
Рейтинг: 86
#23: 2010-11-14 12:41:33 ЛС | профиль | цитата
nesco писал(а):
посмотри на кодировку кракозябр

Да, точно такие же как в цитате.
карма: 0

0
Ответов: 274
Рейтинг: 47
#24: 2010-11-14 19:31:31 ЛС | профиль | цитата
petrocan, Держи Переделаешь под свои нужды
testcp.rar
карма: 0

1
файлы: 1testcp.rar [1.1KB] [92]
Голосовали:petrocan
Ответов: 274
Рейтинг: 47
#25: 2010-11-14 20:59:48 ЛС | профиль | цитата
Перезалил обновленную схему
карма: 0

0
Разработчик
Ответов: 26305
Рейтинг: 2146
#26: 2010-11-15 00:31:30 ЛС | профиль | цитата
Как оказалось, все гораздо проще -- testcp_28591.rar

Надо было просто преобразовывать UTF-8 (кодовое значение -- 65001) в iso-8859-1 (кодовое значение -- 28591) Данные по кодовым значениям cтраниц взяты отсюда -- MSDN Code Page Identifiers
карма: 22

3
файлы: 1testcp_28591.rar [784B] [126]
Голосовали:petrocan, Laetar, Ivann
Ответов: 1379
Рейтинг: 86
#27: 2010-11-15 01:19:03 ЛС | профиль | цитата
nesco, ну ты жжошь
Такое решение всего-то!
карма: 0

0
Разработчик
Ответов: 26305
Рейтинг: 2146
#28: 2010-11-15 01:22:18 ЛС | профиль | цитата
[flood]
petrocan писал(а):
ну ты жжошь

Гы, гы, гы. Мне это не давало покоя, что-то подсказывало, что есть решение гораздо проще, и я его нашел. Теперь, я удовлетворен и спокоен [/flood]
карма: 22

0
28
Сообщение
...
Прикрепленные файлы
(файлы не залиты)