Inici APLEC El Diccionari de sinònims d’Albert Jané

El Diccionari de sinònims d’Albert Jané

COMPARTIR

Josep M. Mestres i Serra

Els qui seguiu aquest blog de l’APLEC deveu recordar que el dia 21 de maig proppassat vam presentar, a la seu de la Biblioteca Central d’Igualada, la tercera edició —en línia— del Diccionari de sinònims d’Albert Jané (DSIN). Permeteu-me que us en faci cinc cèntims.

Aquesta edició del Diccionari de sinònims és el fruit d’una iniciativa que tingué la vicepresidenta de la Secció Filològica de l’Institut d’Estudis Catalans (IEC), Mariàngela Vilallonga, amb la finalitat de posar en el web de l’IEC un diccionari de sinònims de qualitat que fos d’accés lliure.

El punt de partida de l’obra ha estat el text en paper de la segona edició, publicada per l’editorial Barcanova l’any 1995, que contenia un total de 26.500 articles; la primera edició havia estat publicada per l’editorial Aedos l’any 1972, amb una extensió similar i un contingut gairebé idèntic. Per les èpoques en què foren realitzades les dues edicions, no se n’han conservat fitxers informàtics de cap classe.

Aquesta edició disposa essencialment de les mateixes informacions de què constaven les dues primeres edicions en paper: cada article del diccionari consta d’una entrada (el lema, que és la forma que la identifica i encapçala) i d’una o diverses llistes de sinònims, disposades per accepcions (els diferents sentits o significats de l’entrada); hi afegeix, emperò, altres informacions, com ara la categoria lexicogramatical, adscripció que ha portat a crear homògrafs de les entrades que funcionen amb categories diferents.

Amb vista a aquesta tercera edició, ha calgut dur a terme un conjunt de treballs que han permès traslladar les dades del mer paper a una aplicació informàtica flexible que facilités les consultes per Internet: s’han escanejat totes les pàgines de la segona edició del diccionari, les quals han estat sotmeses posteriorment a un reconeixedor òptic de caràcters (OCR), operació que ha fet possible passar el que només era una imatge a un fitxer de text més o menys estructurat. El pas següent ha estat comprovar que el text escanejat es corresponia totalment amb l’original de la segona edició i, a continuació, s’han pres decisions de caire estructural i de disposició del text amb el vistiplau de l’autor fins a obtenir el diccionari que podem consultar actualment (http://sinonims.iec.cat). Només cal dir que, dels dos camps inicials que tenia cada registre de la base de dades inicial, l’actual consta de vint-i-un camps diferents (incloent-hi el número de registre), nou dels quals són de treball i el contingut llur no és visible.

En el moment d’ésser oberta al públic en línia (desembre del 2015), la present edició conté 33.025 formes diferents aplegades en 27.542 articles, amb un total de 34.377 accepcions (sentits) diferents; els articles tenen entre una i tretze accepcions (vegeu, per ex., passar), i un 18 % dels articles contenen més d’una accepció. D’altra banda, hi ha 1.475 lemes que tenen homògrafs, amb un total de 3.144 formes amb homografia; els homògrafs varien d’un a cinc, a més del lema principal (vegeu, per ex., coral).

Us recomano que el consulteu sovint i que en tragueu el màxim profit: és a dir, gaudiu-ne.

COMPARTIR

FER UN COMENTARI

*