InChI: Diferenzas entre revisións

Contido eliminado Contido engadido
Miguelferig (conversa | contribucións)
Sen resumo de edición
Banjo (conversa | contribucións)
Sen resumo de edición
Liña 33:
| title = The IUPAC International Chemical Identifier (InChI)
| publisher = [[IUPAC]]
| date = 5 Septemberde setembro de 2007
| url = http://www.iupac.org/inchi/release102.html
| accessdate = 2007-09-18}}</ref> Debería terse en conta que, a diferenza do InChI, a InChIKey non é única: aínda que as colisións (dúas moléculas distintas co mesmo InChI) poden estimarse como moi raras, estas ás veces ocorren.<ref>{{cite web | title=InChIKey collision: the DIY copy/pastables | author=E.L. Willighagen | date = 17 September 2011 | url = http://chem-bla-ics.blogspot.nl/2011/09/inchikey-collision-diy-copypastables.html | accessdate = 2012-11-06}}</ref>
Liña 72:
== InChIKey ==
[[Ficheiro:Morphin - Morphine.svg|miniatura|dereita|Estrutura da [[morfina]].]]
O '''InChIKey''' |estándar urlde =27 http://www.iupac.org/inchi/release102.htmlcaracteres }}condensado é unha versión con [[función hash]] do InChI estándar completo (que usa o algoritmo [[SHA-256]]), deseñado para permitir buscas de web fáciles de compostos químicos.</ref name=IUPACInChIKey/> A maioría das estruturas químicas na Web ata 2007 eran representadas como [[Graphics Interchange Format|ficheiros GIF]], nos que non se pode buscar contido químico. O InChI completo demostrou ser demasiado longo para unha busca fácil, e, por tanto, desenvolveuse o InChIKey. Hai unha pequena probabilidade de que dúas moléculas diferentes teñan a mesma InChIKey, pero a probabilidade de duplicación considerando só os primeiros 14 caracteres estimouse como de só unha duplicación en 75 bases de datos que contivesen cada unha mil millóns de estruturas únicas. Como todas as bases de datos existentes actualmente teñen menos de 50 millóns de estruturas, é moi improbable que esas duplicacións aparezan no presente. Un estudo recente examinou máis detalladamente a taxa de colisión e atopou que a taxa de colisión experimental está en concordancia co agardado teoricamente.<ref>{{Cite journal | last1 = Pletnev | first1 = I. | last2 = Erin | first2 = A. | last3 = McNaught | first3 = A. | last4 = Blinov | first4 = K. | last5 = Tchekhovskoi | first5 = D. | last6 = Heller | first6 = S. | doi = 10.1186/1758-2946-4-39 | title = InChIKey collision resistance: An experimental testing | journal = Journal of Cheminformatics | volume = 4 | issue = 1 | pages = 39 | year = 2012 | pmid = 23256896| pmc = 3558395}}</ref>
O '''InChIKey''' estándar de 27 caracteres condensado é unha versión con [[función hash]] do InChI estándar completo (que usa o algoritmo [[SHA-256]]), deseñado para permitir buscas de web fáciles de compostos químicos.<ref name=IUPACInChIKey>{{cite web
| title = The IUPAC International Chemical Identifier (InChI)
| url = http://www.iupac.org/inchi/release102.html }}</ref> A maioría das estruturas químicas na Web ata 2007 eran representadas como [[Graphics Interchange Format|ficheiros GIF]], nos que non se pode buscar contido químico. O InChI completo demostrou ser demasiado longo para unha busca fácil, e, por tanto, desenvolveuse o InChIKey. Hai unha pequena probabilidade de que dúas moléculas diferentes teñan a mesma InChIKey, pero a probabilidade de duplicación considerando só os primeiros 14 caracteres estimouse como de só unha duplicación en 75 bases de datos que contivesen cada unha mil millóns de estruturas únicas. Como todas as bases de datos existentes actualmente teñen menos de 50 millóns de estruturas, é moi improbable que esas duplicacións aparezan no presente. Un estudo recente examinou máis detalladamente a taxa de colisión e atopou que a taxa de colisión experimental está en concordancia co agardado teoricamente.<ref>{{Cite journal | last1 = Pletnev | first1 = I. | last2 = Erin | first2 = A. | last3 = McNaught | first3 = A. | last4 = Blinov | first4 = K. | last5 = Tchekhovskoi | first5 = D. | last6 = Heller | first6 = S. | doi = 10.1186/1758-2946-4-39 | title = InChIKey collision resistance: An experimental testing | journal = Journal of Cheminformatics | volume = 4 | issue = 1 | pages = 39 | year = 2012 | pmid = 23256896| pmc = 3558395}}</ref>
 
As InChIKeys constan de 14 caracteres que son o resultado dun ''hash'' da información de conectividade do InChI, seguidos dun [[hifen]], seguido de 10 caracteres orixinados a partir dun ''hash'' das restantes capas do InChI, seguidas dun só carácter que indica a versión do InChI usado, e outro hifen, seguido dun só carácter de [[suma de verificación]] (''checksum'').