|
Documentación y
fuentes informativas. Curso 2001/2002
|
||
|
|
Tema 5: Análisis documental de la información impresa
Concepto de análisis documentalEl análisis documental se define como el proceso de lectura, síntesis y representación de un texto. En el caso de los textos periodísticos el análisis documental se realizará aplicando a los textos a analizar el esquema de Laswell, las 5W's. El resultado del análisis documental, además de la ficha catalográfica, será un conjunto de palabras que representan el contenido del texto de un documento. Estas palabras representativas del texto son las palabras claves o descriptores por los que un usuario podrá más tarde recuperar ese documento. Cuando las palabras que representan el documento son extraídas del lenguaje natural, sin ningún tipo de restricciones, o de una lista de palabras sin relaciones semánticas entre ellas, se habla de palabras claves. Cuando las palabras que representan a un texto se escojen de una lista cerrada de palabras claves pertenecientes a un tesauro, palabras que mantienen una relación semántica entre ellas, se habla de descriptores. Los lenguajes documentalesLos lenguajes documentales son conjuntos normalizados y normativos de términos relacionados de forma semántica y que se utilizan para optimizar el proceso de recuperación de información reduciendo la incertidumbre, la dificultad de predicción, entre las palabras que elije un analista para representar un texto y las que elije un usuario para recuperarlo. Tipos de lenguajes documentales
Lenguajes de estructura jerárquica y lenguajes de estructura combinatoriaDentro de los lenguajes controlados se puede distinguir entre lenguajes de estructura jerárquica y lenguajes de estructura combinatoria. Los lenguajes de estructura jerárquica se caracterizan, sobre todo, porque todos los conceptos dependen de uno superior, de significado más genérico, que a su vez se integra en otro superior y así sucesivamente. O sea, los conceptos se disponen en riguroso orden decreciente de amplitud sémica. El ejemplo más famoso de este tipo de lenguaje es el de la CDU (Clasificación Decimal Universal) en donde la representación de cualquier documento se codifica en base a unas pocas materias. Los lenguajes de estructura combinatoria se caracterizan porque los términos o descriptores se combinan sin quedar sujetos en una posición determinada. Los dos grandes tipos de lenguajes de estructura combinatoria son: los léxicos documentales y los tesauros. Los léxicos documentales pueden ser: alfabéticos de materias, de unitérminos y de descriptores. Los tesauros son un conjunto finito de términos que generalmente representan un campo del saber específico y que se caracteriza porque los términos que lo componen mantienen entre ellos relaciones semánticas de tipo jerárquico, asociativo o preferencial y que admiten notas aclaratorias para acotar la acepción de los términos que lo componen. Los problemas de la representación por medio de palabras clavesEl resultado del análisis documental de un texto es su representación mediante palabras claves o descriptores. El gran problema en la búsqueda de información es la de hacer coincidir los términos que utilizó el analista para representar un texto con los términos que tiempo después utilizará el usuario para recuperar ese texto. La consecuencia de este problema en la recuperación de información son dos fenómenos no deseados por los usuarios: el ruido: documentos que se recuperan y que no son relevantes a la búsqueda que realiza el usuario y el silencio: documentos que existen en la base de datos, que interesarían al usuario que busca información y que sin embargo no se recuperan porque no ha habido coincidencia entre los términos que utilizó el analista y los que luego utiliza el usuario que busca información. Las razones que explican los problemas del ruido y silencio se deben fundamentalmente a:
Bibliografía
|
|
|
© Tony Hernández. Universidad Carlos III de Madrid. Curso 2001/2002 |
||