Il prigioniero che ha rivoluzionato la lingua cinese con una tazza da tè

Zhi si sentì molto incoraggiato. Il suo lavoro solitario procedeva parallelamente a questi sforzi più grandi. La maggior parte di loro, tuttavia, non era ancora riuscita a liberarsi da tastiere goffe. Sebbene la scomposizione dei caratteri in componenti avesse funzionato abbastanza bene per specifici indici di recupero dei caratteri e design della tastiera della macchina da scrivere, non si è tradotta direttamente nella programmazione di un tale processo per una macchina informatica.

Zhi ha ricordato il vantaggio dell’approccio basato sulla forma, in cui le parti del personaggio aiutavano a identificare direttamente l’intero personaggio. Per integrare quell’utile principio nel suo schema di codifica, Zhi decise di indicizzare i caratteri in base ai loro componenti, i caratteri più semplici all’interno di ogni ideogramma, usando la prima lettera dell’ortografia pinyin di ogni componente.

L’idea ha impiegato altri due anni per concretizzarsi. In media, i personaggi possono essere suddivisi in due o quattro componenti e ci sono da 300 a 400 componenti in totale. La maggior parte dei caratteri può essere divisa in due metà, verticale o orizzontale, insieme ad altre possibili geometrie. Ciò ha prodotto un codice alfabetico da due a quattro lettere per ogni carattere, il che significava che ogni carattere richiedeva al massimo quattro sequenze di tasti su una tastiera inglese convenzionale. La lunghezza media delle parole inglesi, in confronto, è vicina a 4,8 lettere. Zhi ha quindi fatto funzionare l’alfabeto in modo più efficiente per i singoli ideografi di quanto non facesse per l’inglese. Il sistema ha anche abilmente aggirato il problema della differenza dialettale e degli omofoni. Poiché il codice prendeva solo la prima lettera, piuttosto che il suono completo del carattere, la maggior parte delle variazioni del parlato regionali non avevano importanza. Il codice di quattro lettere funzionava come un acronimo delle diverse parti del personaggio. Zhi essenzialmente usava l’alfabeto come proxy per l’ortografia per componenti piuttosto che per parole.

Ha sequenziato i componenti di ogni personaggio nell’ordine in cui sarebbero stati scritti a mano. La codifica per componenti ha fornito contesto e spunti importanti che hanno ridotto l’ambiguità e il rischio di codici duplicati. Le possibilità di avere gli stessi componenti, o anche componenti che iniziano con la stessa lettera, si verificano nello stesso identico ordine in due caratteri diversi sono basse.

Il modo in cui Zhi indicizza il carattere cinese in base ai suoi componenti alfabetici ha reso più facile per gli esseri umani inserire il cinese, purché tu sappia come scrivere la lingua, e ha creato un’interfaccia uomo-macchina più sistematica. Ad esempio, nel suo sistema, il carattere di “strada”,路 (l), che ha 13 battute a mano, può essere suddiviso in soli quattro componenti: 口 (kou) , fine (zhi), 攵 (Potevo) e bocca (kou). Isolando la prima lettera di ogni componente si ottiene il codice carattere di KZPK. Oppure prendi il carattere 吴 (wu), cognome comune, che può essere rapidamente scomposto in due parti, 口 (kou) e giorni (tian), ottenendo un codice carattere di KT.

L’ortografia alfabetica, una volta mediata dal cinese in questo modo, non è più un sistema fonetico ma semantico, in cui ogni lettera rappresenta effettivamente un carattere piuttosto che un suono. Questo metodo di indicizzazione può anche essere esteso per rappresentare gruppi di caratteri. Prendi, ad esempio, “socialismo” o shehui zhuyi: 社会主义. Contrassegnando la prima lettera di ciascuno dei quattro caratteri della frase, la frase può essere codificata in una sequenza di quattro lettere, SHZY. Oppure considera un’altra frase usata di frequente, i sette caratteri che compongono la “Repubblica Popolare Cinese” — Zhonghua renmin gongheguo: 中华人民共和国. Può essere semplicemente digitato come ZHRMGHG.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.