-
Пройти Антиплагиат ©



Главная » Документальные информационно поисковые системы (ДИПС) » 15. 16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ИС.



16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ИС.

Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная. Найти рефераты и курсовые по данной теме Уникализировать текст 



Системы кодирования информации Запись идентификации объекта проводится с помощью условных обозначений в виде знака или группы знаков по определенным правилам. Условное обозначение объекта при этом называется кодом, а совокупность методов и правил условного обозначения — системой кодирования.
кодирование — это процесс присвоения условных обозначений (кодов) объектам и классификационным группам в соответствии с определенной системой кодирования. Код в системе кодирования задается тройкой: с=(А, L, S), где А — алфавит (множество символов, используемых при записи кода), L — длина (число позиций в коде);
S — структура кода (порядок расположения в коде символов, используемых для обозначения классификационного атрибута). Различают следующие типы алфавитов: цифровой, буквенный и смешанный. Структура кода представляет собой, как правило, графическое изображение последовательности расположения символов алфавита.
Системы кодирования, поддерживающие методы логического упорядочения объектов с дальнейшим присваиванием отдельному объекту некоторого кода, определяющего место объекта в принятом логическом порядке, называют регистрационными.I
При использовании классификационных схем для идентификации группы объектов кодирование отдельного объекта состоит в присвоении объекту кода определенного класса классификации, системы кодирования могут быть названы классификационными.
С точки зрения длины кода: системы кодирования кодами фиксированной длины и системы кодирования кодами переменной длины. В кодах фиксированной длины каждый разряд идентифицирует конкретный атрибут классификационной схемы. Коды переменной длины ориентированы на идентификацию значений только тех характеристических атрибутов, которые определяют классификационную группу.
Классификационное кодирование применяется при кодировании объектов на основании предварительной их классификации (правила кодирования в системе кодирования определяются классификационной схемой). Различают последовательное и параллельное классификационное кодирование.
Последовательное используется для иерархической классификационной структуры: сначала записывается код класса 1-го уровня, затем код класса 2-го уровня, затем код класса 3-го уровня и т. д. В результате получается кодовая комбинация, каждый разряд которой содержит информацию о значении определенного характеристического атрибута объекта. Объекты с одинаковыми кодами составляют класс иерархической классификации.
Параллельное кодирование используется для фасетной системы классификации: все фасеты кодируются независимо друг от друга; для значений каждого фасета выделяется определенное количество разрядов кода. Параллельная система кодирования обладает теми же достоинствами и недостатками, что и фасетная система классификации. основано на предварительной фасетной классификации.
Регистрационное кодирование используется для однозначной идентификации объектов и не требует предварительной классификации объектов. Различают порядковую и серийно-порядковую системы.
Порядковая предполагает последовательную нумерацию объектов числами натурального ряда. Этот порядок может быть случайным или определяться после предварительного упорядочения объектов, например по алфавиту. Каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера.
Серийно-порядковая предусматривает предварительное выделение групп объектов, которые составляют серию, а затем в каждой серии производится порядковая нумерация объектов. Каждая серия при этом также будет иметь порядковую нумерацию. удобна, когда количество групп невелико. кодами служат числа натурального ряда с закреплением отдельных серий этих чисел за объектами классификации с одинаковыми признаками.
Координатное индексирование базируется на положении, что смысловое содержание документа и информационной потребности может быть с достаточной степенью точности и полноты выражено соответствующим списком так называемых ключевых слов, которые явно или в скрытом виде содержатся в тексте. Под ключевыми словами понимаются наиболее существенные для этой цели слова и словосочетания, обладающие назывной функцией. Кроме назывных в качестве ключевых слов могут выступать также соответствующие численные характеристики, хронологические данные, диапазоны температур, давлений и т. д. координатное индексирование — это способ выражения основного смыслового содержания документа или информационной потребности в виде определенной совокупности ключевых слов.
При «чистом» координатном индексировании ключевые слова в поисковых образах никак не связаны одно с другим и функционируют самостоятельно. Для отыскания документов необходимо выполнить определенные логические операции над классами, которые обозначены ключевыми словами поисковых образов документов. В простейшем случае, когда поисковое предписание сформулировано в виде логического произведения (конъюнкции) некоторого множества ключевых слов, документ считается отвечающим на информационный запрос и подлежит выдаче, если в поисковом образе этого документа одновременно содержатся все ключевые слова поискового предписания.
 



Лекция, реферат. 16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ИС. - понятие и виды. Классификация, сущность и особенности. 2021.

Оглавление книги открыть закрыть

1. 1. Определения понятия «информации». Прагматические и атрибутивные свойства информации.
2. 2. Свойства концентрации и рассеяния информации. Характер закономерностей.
3. 3. Понятия «информационный объект», «информационное взаимодействие».
4. 4. Определение понятия информации с точки зрения информационного взаимодействия.
5. 6. Модель процесса генерации знания в рамках общей теории систем.
6. 7. Соотношение понятий «данные», «информация», «знания».
7. 8. Модель процесса информирования. Типовые схемы информирования.
8. 9. Потребители, приемники информации, информационная потребность. Понятие формальной и истинной релевантности документа.
9. 10. Определение ИС. Организационно-функциональная структура АИС
10. 11. Назначение и классификация информационных систем. Конкретная и абстрактная ИПС. Отличия документальных и фактографических ИПС.
11. 12. Структурная схема процессов в абстрактной АИПС. Режимы ретроспективного поиска и ИРИ.
12. 13. Состав, назначение, требования к ИПЯ. Классификация дескрипторных ИПЯ.
13. 14. Парадигматические и синтагматические отношения между лексическими единицами ИПЯ. Меры близости лексических единиц.
14. 15. Предкоординированные и посткоординированные информационно-поисковые языки.
15. 16. Индексирование и кодирование информации. Особенности представления информации в документальной и фактографической ИС.
16. 17. Обобщенная схема воспроизводства информации. Характеристика информационных компонент.
17. 18. Типология информационных потребностей (когнитивная модель)
18. 19. Типология неопределенностей информационного поиска. Уровневая модель представления информации и информационных потребностей.
19. 21. Понятие стратегии и технологии поиска. Связь стратегии и типа поисковой задачи.
20. 22. Логика поиска. Критерий смыслового соответствия. Теоретико-множественное представление.
21. 23. Информация в системе воспроизводства знаний (системный подход). Информационные компоненты в системах управления.
22. 24. Уровневая модель информационного взаимодействия
23. 25. Типология простых (фактографических) запросов и организация поисковых массивов для различных типов запросов.
24. 26. Расширенное логическое выражение запроса (обобщенная форма). Основные виды операторов и операндов.
25. 27. Назначение и организация инвертированной формы представления документальной информации. Примерная организация поисковых массивов документальной ИПС дескрипторного типа.
26. 28. Типы обратной связи в технологии информационного поиска.
27. 29. Линейная модель механизма поиска по совпадению терминов.
28. 30. Линейная модель механизма поиска по логическому выражению.
29. 31. Линейная модель механизма поиска документов-аналогов.
30. Линейная модель механизма эвристического поиска.
31. Линейная модель механизма поиска по технологии обратной связи по релевантности терминов.
32. Матрицы ассоциации документов, терминов и их свойства.
33. Типология и показатели оценки эффективности информационного поиска. Определение первичных координат описания выхода ИПС.
34. 36. Основные частные и интегральные критерии оценки АИПС.
35. 37. Понятие рабочей характеристики АИПС.
36. 38. Матрицы
37. 39. Диаграмма Эйлера-Венна (диаграмма <L>). Критерии оценки АИПС в координатах <L>.
38. 40. Таблица сопряженности. Критерии оценки АИПС в координатах <a,b,c,d>.
39. 41. Диаграмма <n,x>. Критерии оценки АИПС в координатах <n,x>.
40. 42. Коэффициент линейной корреляции множества выданных и истинно релевантных документов.
41. 43. Назначение, состав и структура лингвистического обеспечения ИС.
42. 44. Основные методы идентификации объектов.
43. 45. Классификация. Определение и формально–логические правила построения.
44. 46. Типы классификаций. Иерархические классификации. Примеры.
45. 47. Типы классификаций. Фасетные классификации. Примеры.
46. 48. Сравнительная характеристика иерархических и фасетных классификаций.
47. 49. Кодирование объектов. Системы кодирования. Примеры.
48. 50. Назначение, структура и использование информационно-поисковых тезаурусов.
49. 51. Обобщенная технологическая схема и компоненты информационного поиска.
50. 52. Типовые реализации интерфейсов подготовки поисковых выражений, их особенности.




« назад Оглавление вперед »
14. 15. Предкоординированные и посткоординированные информационно-поисковые языки. « | » 16. 17. Обобщенная схема воспроизводства информации. Характеристика информационных компонент.






 

Похожие работы:

Воспользоваться поиском

 

Учебники по данной дисциплине

Информатика. Учебник. Часть 1.
Информатика. Учебник. Часть 2.
Основы информационного менеджмента
Информационные технологии. Курс лекций
Основы внедрения информационных систем
Теория управления. Лекции
Основы борьбы с киберпреступностью
Стандартизация и сертификация программного обеспечения