"Текстовые" дополнения к нераспознанным книгам
|
|
|
|
Привет всем! У меня есть предложение насчет повышения полезности сайта. Поскольку большинство материалов представлены в виде картинок - т.е. не содержат текстового слоя, то поиск по содержимому книги не представляется возможным. Я предлагаю выделить специальный раздел для Текстовых версий документов - т.е. книга распознается FineReader'ом, сохраняется в формате txt, затем книга добавляется на сайт и рядом с ссылкой на файлообменник делается маленькая ссылочка на тот же материал, но в виде текста. Это часто делается для индексации поисковыми системами материалов на сайтах. Так делается, например, на сайте window.edu.ru. Например, пользователь вбивает в поисковую строку яндекса фразу "Правило наименования полукругового азимута" - и система ему тут же выдает распознанную версию пособия. Можете проверить Это представляется мне довольно удобным.
|
62 сообщения
Нет замечаний
|
Сообщение № 1 (Пятница, 23 Окт 2009, 12:59)
|
|
|
|
|
|
UPD: пример того, как это будет выглядеть, см. в новости, посвященной архитектурным обмерам (текстовую версию загрузил на свой старый заброшенный сайт narod.ru)
|
62 сообщения
Нет замечаний
|
Сообщение № 2 (Пятница, 23 Окт 2009, 13:38)
|
|
|
|
|
|
Меня эта идея вполне устраивает! Надо только придумать как автоматизировать это "добавление". Не грузить же текстовый файл на файлообменник? Пока то, что Вы, hegus, делаете, мне нравится (я про подход к новостям). Только, боюсь кроме Вас текстовики больше никто прикладывать не будет (возможно пока). Спасибо за идею!
|
467 сообщений
|
"Если Вас не критикуют, то возможно Вы ничего не делаете..." Вопросы по оформлению новостей hot_pepper_bs@mail.ru |
Сообщение № 3 (Пятница, 23 Окт 2009, 14:17)
|
|
|
|
|
|
Может быть, возможно выделить какое-либо дисковое пространство для данной папки на хостинге? А при добавлении новости было бы удобно нажать на кнопку "прикрепить файл" и этот файл автоматически загружался в данную папку. Таким образом, кроме того, можно многократно повысить возможности "поиска по сайту". Мне это представляется как-то так. Спасибо, взаимно!
|
62 сообщения
Нет замечаний
|
Сообщение № 4 (Пятница, 23 Окт 2009, 14:50)
|
|
|
|
|
|
Quote А при добавлении новости было бы удобно нажать на кнопку "прикрепить файл" и этот файл автоматически загружался в данную папку Это возможно, только у нас не тот модуль активирован . Посмотрим, технически есть возможность грузить на наш сервер файлы до 15Мб (ну это только если постораться, а так до 2-5Мб без проблем), но вот просто кнопочку пока нажать вряд ли придётся. Хотя, не знаю, нужно пилить движок напильником.
|
742 сообщения
|
Сообщение № 5 (Пятница, 23 Окт 2009, 15:06)
|
|
|
|
|
|
Это предложение возникло потому, что многие книги из моей электронной библиотеки, распознаны . И, поскольку у меня стоит программа Google Desktop Search, я могу искать нужную мне информацию не выходя в интернет - и качество ее намного выше. Это удобно. Насчет объема: Том 5 ВИА (654 стр) скачанный с торрентс.ру в формате txt занимает 2,54 Мб.
|
62 сообщения
Нет замечаний
|
Сообщение № 6 (Пятница, 23 Окт 2009, 15:16)
|
|
|
|
|
|
После разговора с Сергеем, пришли к выводу, что открывать новый модуль не будем, т.к. далеко не все выкладывающие новости будут выкладывать текстовый вариант. Но это не говорит о том, что на идее мы ставим крест. Просто сейчас этого не имеет смысла и требует много подгонок движка. Если вы хотите загружать файлы на наш сайт, загружайте на форуме, скоро (при VIP Доступе, который вам обеспечен) вам будет доступна загрузка любых файлов на форум весом до 2Мб (больше не примет. Общий размер одновременно загружаемых файлов не может превышать 15Мб). Т.е. создаёте свою тему в правильном разделе, называете тему как надо, загружаете файлы точно так же как изображения, а потом кидаете ссылки на эти прикреплённые файлы и готово. Можете продолжить загружать на свой сайт, выбор за вами. И ещё, если вы так ратуете за то, чтобы происходила более качественная индексация, то многие поисковики «кушают» pdf намного лучше txt, и если посмотреть, то в Едином Окне все файлы представлены именно в pdf. Google и Yandex не исключение.
|
742 сообщения
|
Сообщение № 7 (Пятница, 23 Окт 2009, 16:06)
|
|
|
|
|
|
Да, наверно загрузка текстовой версии для ознакомления на какой-то сторонний сайт это пока лучший вариант - если указывать, куда идти за растровой версией, разумеется. Спасибо, очень буду рад вступить в ряды VIP пользователей и делами поддерживать это почетное звание. Согласен, что поисковики индексируют pdf довольно неплохо, НО только если там есть OCR слой и эти самые pdf файлы выложены непосредственно на сам сайт (а не на файлообменник) и не в сжатом виде. К тому же, pdf файлы довольно громоздки для предварительного ознакомления с материалом. С уважением, ЕгорВ последний раз редактировалось hegus - Пятница, 23 Окт 2009, 16:28
|
62 сообщения
Нет замечаний
|
Сообщение № 8 (Пятница, 23 Окт 2009, 16:24)
|
|
|
|