Архитектурная Графика
Ленточный вариант форума | Участники | Правила форума | Поиск по форуму
  • Страница 1 из 1
  • 1
"Текстовые" дополнения к нераспознанным книгам
Привет всем! У меня есть предложение насчет повышения полезности сайта. Поскольку большинство материалов представлены в виде картинок - т.е. не содержат текстового слоя, то поиск по содержимому книги не представляется возможным. Я предлагаю выделить специальный раздел для Текстовых версий документов - т.е. книга распознается FineReader'ом, сохраняется в формате txt, затем книга добавляется на сайт и рядом с ссылкой на файлообменник делается маленькая ссылочка на тот же материал, но в виде текста.
Это часто делается для индексации поисковыми системами материалов на сайтах.
Так делается, например, на сайте window.edu.ru. Например, пользователь вбивает в поисковую строку яндекса фразу "Правило наименования полукругового азимута" - и система ему тут же выдает распознанную версию пособия. Можете проверить smile
Это представляется мне довольно удобным.
62 сообщения
+44
Нет замечаний
Сообщение № 1
top
UPD: пример того, как это будет выглядеть, см. в новости, посвященной архитектурным обмерам (текстовую версию загрузил на свой старый заброшенный сайт narod.ru)
62 сообщения
+44
Нет замечаний
Сообщение № 2
top
Меня эта идея вполне устраивает! Надо только придумать как автоматизировать это "добавление". Не грузить же текстовый файл на файлообменник? wacko

Пока то, что Вы, hegus, делаете, мне нравится (я про подход к новостям). Только, боюсь кроме Вас текстовики больше никто прикладывать не будет (возможно пока).

Спасибо за идею!

467 сообщений
"Если Вас не критикуют, то возможно Вы ничего не делаете..."

Вопросы по оформлению новостей hot_pepper_bs@mail.ru
Сообщение № 3
top
Может быть, возможно выделить какое-либо дисковое пространство для данной папки на хостинге? А при добавлении новости было бы удобно нажать на кнопку "прикрепить файл" и этот файл автоматически загружался в данную папку. Таким образом, кроме того, можно многократно повысить возможности "поиска по сайту". Мне это представляется как-то так.
Спасибо, взаимно!
62 сообщения
+44
Нет замечаний
Сообщение № 4
top
Quote
А при добавлении новости было бы удобно нажать на кнопку "прикрепить файл" и этот файл автоматически загружался в данную папку

Это возможно, только у нас не тот модуль активирован smile . Посмотрим, технически есть возможность грузить на наш сервер файлы до 15Мб (ну это только если постораться, а так до 2-5Мб без проблем), но вот просто кнопочку пока нажать вряд ли придётся. Хотя, не знаю, нужно пилить движок напильником.

742 сообщения
Сообщение № 5
top
Это предложение возникло потому, что многие книги из моей электронной библиотеки, распознаны . И, поскольку у меня стоит программа Google Desktop Search, я могу искать нужную мне информацию не выходя в интернет - и качество ее намного выше. Это удобно.
Насчет объема: Том 5 ВИА (654 стр) скачанный с торрентс.ру в формате txt занимает 2,54 Мб.
62 сообщения
+44
Нет замечаний
Сообщение № 6
top
После разговора с Сергеем, пришли к выводу, что открывать новый модуль не будем, т.к. далеко не все выкладывающие новости будут выкладывать текстовый вариант. Но это не говорит о том, что на идее мы ставим крест. Просто сейчас этого не имеет смысла и требует много подгонок движка.

Если вы хотите загружать файлы на наш сайт, загружайте на форуме, скоро (при VIP Доступе, который вам обеспечен) вам будет доступна загрузка любых файлов на форум весом до 2Мб (больше не примет. Общий размер одновременно загружаемых файлов не может превышать 15Мб). Т.е. создаёте свою тему в правильном разделе, называете тему как надо, загружаете файлы точно так же как изображения, а потом кидаете ссылки на эти прикреплённые файлы и готово. Можете продолжить загружать на свой сайт, выбор за вами.

И ещё, если вы так ратуете за то, чтобы происходила более качественная индексация, то многие поисковики «кушают» pdf намного лучше txt, и если посмотреть, то в Едином Окне все файлы представлены именно в pdf. Google и Yandex не исключение.

742 сообщения
Сообщение № 7
top
Да, наверно загрузка текстовой версии для ознакомления на какой-то сторонний сайт это пока лучший вариант - если указывать, куда идти за растровой версией, разумеется.
Спасибо, очень буду рад вступить в ряды VIP пользователей и делами поддерживать это почетное звание.
Согласен, что поисковики индексируют pdf довольно неплохо, НО только если там есть OCR слой и эти самые pdf файлы выложены непосредственно на сам сайт (а не на файлообменник) и не в сжатом виде. К тому же, pdf файлы довольно громоздки для предварительного ознакомления с материалом.
С уважением, Егор
В последний раз редактировалось hegus - Пятница, 23 Окт 2009, 16:28
62 сообщения
+44
Нет замечаний
Сообщение № 8
top
  • Страница 1 из 1
  • 1
Поиск:
Чтобы оставить ответ, необходимо авторизоваться.

top Вверх
Зарег. на сайте:
Всего: 16102
Новых за месяц: 5
Новых за неделю: 2
Новых вчера: 0
Новых сегодня: 0
Из них:
Администраторов: 3
Модераторов: 2
VIP пользователей: 43
Проверенных: 141
Рядовых: 15901


 RSS
О сайте
Контакты
Главная | Новости | Статьи | VIP | Форум | Памятники Архитектуры | Последние комментарии
Архитектурная Графика: электронная библиотека для архитекторов, градостроителей и проектировщиков / Сайт создан в системе uCoz. — [Б.м.], 2008—2024.
Материалы предоставлены бесплатно. Копирование и коммерческое использование материалов без письменного согласия авторов запрещены.