Cyc

base de coneixement i projecte d'intel·ligència artificial

Cyc (pronunciat /ˈsk/ syke) és un projecte d'intel·ligència artificial a llarg termini que té com a objectiu reunir una ontologia integral i una base de coneixement que abasta els conceptes bàsics i les regles sobre com funciona el món. Amb l'esperança de captar el coneixement de sentit comú, Cyc se centra en el coneixement implícit. El projecte va començar el juliol de 1984 a MCC i va ser desenvolupat més tard per l'empresa Cycorp.

Quatre logotips del projecte Cyc estan integrats en aquesta imatge.

El nom "Cyc" (de "enciclopèdia") és una marca registrada propietat de Cycorp. CycL té una especificació publicada públicament, i desenes de mòduls HL (nivell heurístic) es van descriure al llibre de text de Lenat i Guha, [1] però el codi del motor d'inferència de Cyc i la llista completa de mòduls HL són propietaris de Cycorp.[2]

Història

modifica

El projecte va començar el juliol de 1984 per Douglas Lenat com un projecte de la Microelectronics and Computer Technology Corporation (MCC), un consorci de recerca iniciat per dues corporacions amb seu als Estats Units "per contrarestar un esforç japonès aleshores nefast en IA, l'anomenat " projecte de cinquena generació ".[3] Els Estats Units van aprovar la National Cooperative Research Act de 1984, que per primera vegada va permetre a les empreses nord-americanes "connir" en recerca a llarg termini. Des de gener de 1995, el projecte ha estat desenvolupat actiu per Cycorp, on Douglas Lenat n'era el conseller delegat.

El llenguatge de representació CycL va començar com una extensió de RLL [4] (el llenguatge de representació, desenvolupat entre 1979 – 1980 per Lenat i el seu estudiant de postgrau Russell Greiner mentre estava a la Universitat de Stanford). El 1989, [5] Cycle s'havia expandit en poder expressiu a la lògica d'ordre superior (HOL).

L'ontologia de Cyc va créixer a uns 100.000 termes el 1994 i, a partir del 2017, contenia uns 1.500.000 termes. La base de coneixement Cyc que implica termes ontològics es va crear en gran part mitjançant l'escriptura manual d'axiomes; era al voltant d'1 milió el 1994 i, a partir del 2017, és d'uns 24,5 milions.

El 2008, els recursos de Cyc es van assignar a molts articles de la Viquipèdia.[6] Cyc està connectat actualment a Wikidata.

Base de coneixement

modifica

La base de coneixement es divideix en microteories. A diferència de la base de coneixement en el seu conjunt, cada microteoria ha d'estar lliure de contradiccions monòtones. Cada microteoria és un objecte de primera classe en la Cyc ontologia; té un nom que és una constant regular. Els noms de concepte a Cyc són termes o constants de Cycle.[7] Les constants comencen amb un #$ opcional i distingeixen entre majúscules i minúscules. Hi ha constants per a:

  • Elements individuals coneguts com a persones, com ara #$BillClinton o #$France.
  • Col·leccions, com ara #$Tree-ThePlant (que conté tots els arbres) o #$EquivalenceRelation (que conté totes les relacions d'equivalència). Un membre d'una col·lecció s'anomena instància d'aquesta col·lecció.[8]
  • Funcions, que produeixen nous termes a partir d'uns donats. Per exemple, #$FruitFn, quan es proporciona un argument que descriu un tipus (o col·lecció) de plantes, retornarà la col·lecció dels seus fruits. Per convenció, les constants de funció comencen amb una lletra majúscula i acaben amb la cadena Fn.
  • Funcions de veritat, que es poden aplicar a un o més conceptes i retornar cert o fals. Per exemple, #$siblings és la relació de germans, cert si els dos arguments són germans. Per convenció, les constants de la funció de veritat comencen amb una lletra minúscula.

Per a cada instància de la col·lecció #$ChordataPhylum (és a dir, per a cada cordat), existeix un animal femení (instància de #$FemaleAnimal ), que és la seva mare (descrita pel predicat #$biologicalMother).[9]

Motor d'inferència

modifica

Un motor d'inferència és un programa informàtic que intenta obtenir respostes a partir d'una base de coneixement. El motor d'inferència Cyc realitza una deducció lògica general.[10] També realitza raonament inductiu, aprenentatge automàtic estadístic i aprenentatge automàtic simbòlic i raonament abductiu.

El motor d'inferència Cyc separa el problema epistemològic del problema heurístic. Per a aquest últim, Cyc va utilitzar una arquitectura de comunitat d'agents en què els mòduls especialitzats, cadascun amb el seu propi algorisme, es prioritzaven si podien avançar en el subproblema.

Aplicacions

modifica

Durant més d'una dècada, Glaxo ha utilitzat Cyc per integrar de manera semiautomàtica els grans tesaurus de termes de la indústria farmacèutica. Anteriorment, utilitzaven personal per fer-ho manualment. La Cleveland Clinic ha utilitzat Cyc per desenvolupar una interfície de consulta en llenguatge natural d'informació biomèdica sobre cirurgies cardiotoràciques.[11] Una consulta s'analitza en un conjunt de fragments CycL amb variables obertes.[12] The Terrorism Knowledge Base era una aplicació de Cyc que intentava contenir coneixements sobre descripcions relacionades amb els "terroristes". El coneixement s'emmagatzema com a enunciats en la lògica matemàtica.[13]

Una aplicació Cyc té l'objectiu declarat d'ajudar els estudiants a fer matemàtiques a un nivell de 6è.[14] L'aplicació, anomenada MathCraft, [15] havia de fer el paper d'un company d'estudiant que està una mica més confós que l'usuari sobre el tema. Com que l'usuari dóna bons consells, Cyc permet que l'avatar cometi menys errors.

Referències

modifica
  1. Lenat, Douglas B. Building Large Knowledge-Based Systems; Representation and Inference in the Cyc Project (en anglès). 1st. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1989. ISBN 978-0201517521. 
  2. Lenat, Douglas. «Hal's Legacy: 2001's Computer as Dream and Reality. From 2001 to 2001: Common Sense and the Mind of HAL» (en anglès). Cycorp, Inc.. Arxivat de l'original el 2019-12-09. [Consulta: 26 setembre 2006].
  3. Wood, Lamont Scientific American, 286, 1, 2002, pàg. 18–19. Bibcode: 2002SciAm.286a..18W. DOI: 10.1038/scientificamerican0102-18.
  4. «A Representation Language Language» (en anglès). www.aaai.org. [Consulta: 27 novembre 2017].
  5. Lenat, Douglas B.; Guha, R. V. ACM SIGART Bulletin, 2, 3, 6-1991, pàg. 84–87. DOI: 10.1145/122296.122308. ISSN: 0163-5719.
  6. «Integrating Cyc and Wikipedia: Folksonomy meets rigorously defined common-sense» (en anglès). [Consulta: 10 maig 2013].
  7. Lenat, Douglas B.; Guha, R. V. ACM SIGART Bulletin, 2, 3, 6-1991, pàg. 84–87. DOI: 10.1145/122296.122308. ISSN: 0163-5719.
  8. Lenat, Douglas B. Building Large Knowledge-Based Systems; Representation and Inference in the Cyc Project. 1st. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1989. ISBN 978-0201517521. 
  9. Lenat, Douglas B. Building Large Knowledge-Based Systems; Representation and Inference in the Cyc Project (en anglès). 1st. Boston, MA, USA: Addison-Wesley Longman Publishing Co., Inc., 1989. ISBN 978-0201517521. 
  10. «cyc Inference engine» (en anglès). Arxivat de l'original el 2019-12-09. [Consulta: 4 juny 2015].
  11. «Case Study: A Semantic Web Content Repository for Clinical Research» (en anglès americà). www.w3.org. [Consulta: 28 febrer 2018].
  12. Lenat, Douglas; Witbrock, Michael; Baxter, David; Blackstone, Eugene; Deaton, Chris (en anglès) AI Magazine, 31, 3, 28-07-2010, pàg. 13. DOI: 10.1609/aimag.v31i3.2299. ISSN: 0738-4602 [Consulta: free].
  13. Chris Deaton; Blake Shepard; Charles Klein; Corrinne Mayans; Brett Summers Proceedings of the 2005 International Conference on Intelligence Analysis, 2005.
  14. Lenat, Douglas B.; Durlach, Paula J. (en anglès) International Journal of Artificial Intelligence in Education, 24, 3, 01-09-2014, pàg. 216–250. DOI: 10.1007/s40593-014-0016-x. ISSN: 1560-4292 [Consulta: free].
  15. «Mathcraft by Cycorp» (en anglès). www.mathcraft.ai. [Consulta: 29 novembre 2017].