Скачать 89.57 Kb.
|
ИСПОЛЬЗОВАНИЕ ЯЗЫКА ПРОГРАММИРОВАНИЯ PERL ДЛЯ ВВОДА ДАННЫХ В ЭЛЕКТРОННЫЙ КАТАЛОГ ИРБИС Каримова В.Ф. (Институт экономики УрО РАН) В данном докладе рассматриваются проблемы быстрого ввода данных в электронный каталог Ирбис, и пути их решения с помощью программы MS Excel 2007 и кода Perl. Для наглядности подробно рассматривается пример заполнения полей для записей о диссертациях Института экономики УрО РАН. Постановка проблемы Если характеризовать работу в электронном каталоге Ирбис с точки зрения скорости ввода данных, можно отметить определенные преимущества и недостатки. Неоспоримым достоинством Ирбис являются следующие возможности:
Факторами, которые усложняют работу с электронным каталогом, являются:
Поиск решения При поиске решения вопроса об ускоренном заполнении полей следует отметить, что Ирбис импортирует и экспортирует записи в файле формата .txt, который имеет унифицированную структуру. Формат .txt обеспечивает доступ к файлу на любой платформе (Windows, Unix). Отдельные записи в экспортированном файле четко разделены, каждая строка отдельной записи имеет следующую структуру:
Одна запись электронного каталога может содержать около 20-25 строк, при этом некоторые поля записи являются составными, и включают в себя информацию из нескольких подполей. Таким образом, экспортированный файл имеет очень удобную структуру для обработки с помощью языка программирования. Использование языка программирования позволит облегчить работу каталогизатора по вводу данных, которые повторяются в каждой записи для одного вида документов (поле 900: Вид документа). Язык программирования Perl прекрасно подходит для решения этой задачи в силу следующих преимуществ:
Для решения проблемы выбора необходимых для заполнения полей представляется возможным предложить каталогизатору упрощенный интерфейс, в котором все поля для ввода расположены на одной странице. Для создания такого интерфейса с минимальными временными затратами можно использовать вкладку «Разработчик» программы Excel 2007 пакета Microsoft Office. MS Excel позволяет создавать выпадающее меню с любым списком элементов, блокировать отдельные ячейки, чтобы сделать их недоступными для ввода, а также экспортировать данные в формате .csv1, который, в свою очередь, прекрасно подходит для работы в Perl. Рассмотрим процесс создания записей о диссертациях с помощью MS Excel и кода Perl. Решение: Форма для ввода данных MS Excel В первую очередь, необходимо создать упрощенную форму для ввода записей о диссертациях в MS Excel, в которую войдут только уникальные поля записи: Ф. И. О. автора, название диссертации, степень автора, специальность, и т. д. Эту форму позднее можно будет скопировать и вставить в другие листы. Таким образом, в одном файле MS Excel каталогизатор сможет ввести сразу несколько записей о диссертациях. Чтобы создать форму ввода, воспользуемся вкладкой «Разработчик». Если вкладка не представлена в верхней части окна MS Excel, ее необходимо включить:
Откроем чистый лист MS Excel и назовем его «Форма», и создадим на нем форму для ввода данных, озаглавив каждую ячейку для удобства пользователя, и добавив выпадающее меню для следующих параметров:
Для создания выпадающего меню воспользуйтесь вкладкой «Разработчик»:
Для добавления значений для выбора в выпадающее меню необходимо будет указать источник значений. Целесообразно создать отдельный лист в книге Excel, на котором будут представлены все значения для выпадающего меню (См. Рис. 1) – назовем его «Данные». Рисунок 1. Лист MS Excel с данными для выпадающего меню. Также имеет смысл создать дополнительный лист для вывода всех заполненных полей – назовем его «Сводный лист». Для того, чтобы выпадающее меню начало функционировать, вызовите подменю объекта правой кнопкой мыши:
В подменю «Формат объекта» необходимо создать указать ячейку, в которую MS Excel выведет порядковый номер значения, которое пользователь выбрал из выпадающего меню. Для всех результатов ввода через выпадающее меню зарезервируем отдельную строку в Листе «Сводные данные». Для того, чтобы отобразить все данные, которые были введены каталогизатором нескольких формах для ввода, на одном листе «Сводные данные», воспользуемся следующими формулами:
Важно отметить, что для каждой записи об одной диссертации важно выделить одну строку. Если Вы используете несколько листов ввода в одном файле, необходимо расположить введенные данные в Сводном листе следующим образом (См. Рис. 2): Рисунок 2. Расположение записей о диссертации в Сводном листе Следующий этап работы – сохранение введенных данных. Поскольку все данные записи о диссертации располагаются на Сводном листе, нам необходимо сохранить только одну страницу всего файла MS Excel. Для сохранения данных, которые впоследствии будут обрабатываться с помощью кода Perl, удобно использовать формат .csv. Файл данного формата использует запятые для разделения значений. Поскольку два значения записи о диссертации также могут содержать запятые (поля Название диссертации и Ключевые слова), необходимо изменить разделитель в файле csv. с запятой на другой символ - например, символ «|», который может встретиться среди значений полей с очень низкой долей вероятности. Чтобы изменить разделитель, перейдите в меню «Пуск»:
После сохранения файла со сводным листом в формате .csv, откроем файл в программе Блокнот, и сохраним его в формате .txt с прежним именем (dissertation_data.txt). Если мы отменим Перенос по словам в меню Формат в Блокноте, записи будут иметь следующий вид (См. Рис. 3):
Рисунок 3. Файл dissertation_data.txt (с использованием Переноса по словам) Решение: Создание кода Perl для импорта записей в Ирбис Для того, чтобы импортировать данные в каталог Ирбис, нам необходимо преобразовать файл dissertation_data.txt таким образом, чтобы он включал все данные о диссертациях, структурированные определенным образом для Ирбис. Мы используем код Perl для преобразования файла. Строки, начинающиеся с символа «#», содержат к комментарии к коду, и не читаются системой при работе кода.
Таким образом, файл dissertation_import.txt готов для импорта в каталог Ирбис. Область применения Приведенный в данном докладе код Perl планируется модифицировать для ввода данных о содержании журналов, которые хранятся в Библиотеке Института экономики УрО РАН. Для получения записей о статьях журналов с сайтов издательств мы планируем использовать модуль HTML. В новом коде также будет активно использоваться Regex для распознавания элементов содержания журнала: имен авторов, названий страниц, номеров страниц и названий тематических рубрик оглавления журнала1. 1 Comprehensive Perl Archive Network (CPAN) – Расширенная архивная сеть Perl. На этом сайте Вы сможете найти и загрузить на жесткий диск коды и модули, разработанные другими программистами 1 Comma separated file (CSV) – формат файла, в котором отдельные элементы данных разделены запятыми. |
К таким средствам можно отнести использование команд поиска, фильтрации и использование запросов. Простейшим способом поиска информации... | По заданной схеме данных требуется создать компьютерную реализацию базы данных, выполнив следующие этапы работы: создать базовые... | ||
Абис «Ирбис», другой учетной документации, принятой в библиотеке (лист ежедневной статистики, электронный дневник работы библиотеки,... | Для ввода прописной буквы одновременно нажимают клавишу с её изображением и клавишу | ||
Определяется законодательством. Перед сдачей отчетов в Пенсионный фонд необходимо проверить полноту ввода персональных данных по... | Данная курсовая работа посвящена изучению анимационных эффектов в рамках JavaScript. Раскрывая тему, мы сочли нужным раскрыть понятие... | ||
В программах по С++ можно равноправно использовать две библиотеки ввода – вывода: стандартную библиотеку функций ввода-вывода языка... | Исследование необходимости поддержки структурных изменений в источниках данных 35 | ||
Макет ввода Расчета платы за нвос предназначен для автоматизации ввода и расчета платы за негативное воздействие на окружающую среду... | Я даю согласие на использование персональных данных исключительно в целях формирования базы данных по итогам написания регионального... |
Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |