Вверх ↑
Этот топик читают: Гость
Ответов: 463
Рейтинг: 9
#1: 2008-07-13 10:25:49 ЛС | профиль | цитата
Привет всем.
Такая проблема, хочу создать програмку которая бы могла из документа word создавать html страницу но нормальным кодом ..
ПОМОГИТЕ плиз найти документацию или подскажите КАК можно читать документы Word но без установки последнего на комп.
Ненавижу этот долбаный редактор, ставить на комп не хочу. А читать почту которую присылают надо
Может найдутся единомышленники.

Задача: конвертация doc - > html без установленного (установки ) MS Word.

по форуму искал, но с такой настройкой форума, поиск НИЧЕГО не дает! уж извините, но очень неудобный форум. Хотел его даже на к себе на комп ВЕСЬ скачать(для поиска локально), но не получается. Все схемы что нашел типа SMO? обращаются к приложениям офиса и как я понял сам файл не читает полностью, а только слово- ключ- триггер, который вызывает соответствующее приложение
карма: 0

0
Главный модератор
Ответов: 2999
Рейтинг: 396
#2: 2008-07-13 12:03:23 ЛС | профиль | цитата
Между хочу и могу пропасть, через которую поможет перепрыгнуть или OLE Automation или Вы программист, способный разобраться в формате word-файлов и написать к нему свой парсер. Выбирайте сами, что Вам более подходит.
карма: 6
Дорогу осилит идущий. Install/Update HiAsm.NET
0
Ответов: 3655
Рейтинг: 69
#3: 2008-07-13 15:57:58 ЛС | профиль | цитата
ajaxii писал(а):
КАК можно читать документы Word но без установки последнего на комп.

Насколько я знаю есть такие программы(читают форматы ворда).
ajaxii писал(а):
хочу создать програмку которая бы могла из документа word создавать html страницу но нормальным кодом

Вполне возможно, тут есть два варианта
1)Делать самому конвертер из Ворда в HTML .
2)Сделать оптимизатор кода из фомата Word_HTML вырезать всё лишнее.
Но надо изучать очень много и быстро не получится.
карма: 0

0
Ответов: 16884
Рейтинг: 1239
#4: 2008-07-13 16:04:02 ЛС | профиль | цитата
Поставь OpenOffice.org - бесплатный и работает
карма: 25
Немного терпения! Дежурный экстрасенс скоро свяжется с Вами!
0
Гость
Ответов: 17029
Рейтинг: 0
#5: 2008-07-13 17:30:37 правка | ЛС | профиль | цитата


Редактировалось 1 раз(а), последний 2025-01-17 15:12:44
карма: 0

0
Ответов: 902
Рейтинг: 27
#6: 2008-07-13 18:06:52 ЛС | профиль | цитата
Tad,
бесплатный и работает

А русские что, начали пользоваться платными?
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Ответов: 463
Рейтинг: 9
#7: 2008-07-13 19:18:49 ЛС | профиль | цитата
Вячеслав писал(а):
1)Делать самому конвертер из Ворда в HTML .

Речь и идет об конвертере .
Nic писал(а):
...разобраться в формате word-файлов и написать к нему свой парсер.
если есть материалы, которые помогут буду весьма рад!

Данный инструмент нужен будет всегда, и для решения прикладных задач и вообще как часть проекта (будущего и т.п.)
Тут речь идет не о пакетах и т.п., я могу пачку всяких конвертеров накачать, а о подходе к проблеме как программист (ох буду ли я им когда-нить или нет, пока что очень тяжко во всем разбираться)


карма: 0

0
Разработчик
Ответов: 26264
Рейтинг: 2140
#8: 2008-07-13 19:27:44 ЛС | профиль | цитата
Вот что я нарыл (ну можно и самим это было нарыть, между прочим)

http://www.uinc.ru/articles/39/

Вот только стенания по вопросу непонимания приниматься не будут. Кто захочет, тот разберется.
карма: 22

0
Ответов: 542
Рейтинг: 12
#9: 2009-02-02 12:28:07 ЛС | профиль | цитата
Есть компонент от Вячеслав, для подключения к OLE серверам.
Проблема заключается в том что в нем можно задавать идентификатор сервера но нельзя задать параметр запуска сервера.
Каким образом можно решить эту проблему?

ps. Параметры это текстовая строка которая задается при обычном запуске программ после строки .exe
Компонент прилагается в аттаче
карма: 0

0
файлы: 1elementauto.rar [7KB] [102]
Ответов: 1161
Рейтинг: 160
#10: 2009-02-02 12:31:58 ЛС | профиль | цитата
как я понял, формат DOC - это простой архив ZIP.
Уже через пару минут научился вытыривать из него изображения
карма: 0

0
Ответов: 3851
Рейтинг: 159
#11: 2009-02-02 13:54:43 ЛС | профиль | цитата
LainX писал(а):
формат DOC - это простой архив ZIP

это в какой версии?
карма: 0
начавший
0
Ответов: 1161
Рейтинг: 160
#12: 2009-02-02 16:40:58 ЛС | профиль | цитата
проверил на doc и docx
winrar и total commander считают эти файлы архивами, а 7-zip xt-то замешкался...
на компоненте Zipper пока не пробовал...
------------ Дoбавленo:

и с docx все намного проше...
карма: 0

0
Главный модератор
Ответов: 2999
Рейтинг: 396
#13: 2009-02-03 02:02:21 ЛС | профиль | цитата
Для afandi, http://hiasm.com/forum.html?q=3&p=42906#p42906
карма: 6
Дорогу осилит идущий. Install/Update HiAsm.NET
0
Ответов: 463
Рейтинг: 9
#14: 2010-11-24 11:55:44 ЛС | профиль | цитата
LainX писал(а):
как я понял, формат DOC - это простой архив ZIP.
Уже через пару минут научился вытыривать из него изображения


хм... хотелось бы видеть как? и можно ли вытащить оттуда текст,хотя бы без форматирования ?
карма: 0

0
Ответов: 4641
Рейтинг: 334
#15: 2010-11-24 12:03:16 ЛС | профиль | цитата
ajaxii писал(а):
хм... хотелось бы видеть как?

скорей всего имелось ввиду формат docx, а не doc. docx это архив файлов xml структуры.
карма: 1
Время верстки: %cr_time% Текущее время: %time%
0
Сообщение
...
Прикрепленные файлы
(файлы не залиты)