Primitive ord

I teoretisk informatikk , i kombinatorikk og spesielt i kombinatorikk av ord , er et primitivt ord et ord som ikke er kraften til et annet ord. For eksempel, abbaer et primitivt ord og ababer ikke primitivt siden det er kvadratet av ordet ab. Primitive ord er på en måte den kombinatoriske ekvivalenten til primtall i aritmetikk . De primitive ordene griper inn i forskjellige felt, som ligningene mellom ordene , ordene til Lyndon , de formelle språkene . De er relatert til halskjeder eller sirkulære ord . Et primitivt ord kalles også aperiodisk .

Definisjon

Et ord i et alfabet er primitivt hvis det ikke er kraften til et annet ord, derfor hvis det ikke finnes et ord som for et positivt naturlig tall. Ordet tomt er ikke primitivt.

For et alfabet med to bokstaver er de første primitive ordene:

.

Eiendommer

Unikt

Følgende egenskaper finnes i lærebøker, for eksempel de fra Lothaire eller Shallit

Eiendom 1  -  Ethvert ord er unikt skrevet som kraften til et primitivt ord.

Noen ganger finner vi navnet "rot" for å betegne det unike primitive ordet som er en kraft; det er også bemerket . Heltallet slik som er "eksponenten" av . For eksempel for , og med eksponent 3. Eiendommen er bevist ved hjelp av lemmaet nedenfor.

Eiendom 2  -  Konjugatene til et primitivt ord er i seg selv primitive.

Ta for eksempel . Dens konjugater er

.

De er alle primitive.

Eiendom 3  -  Bøyningsklassen til et primitivt ord med lengde har elementer.

Antall primitive ord

Da konjugatene til et primitivt ord alle er forskjellige, for hvis det var to like, ville de verifisere en ligning som er beskrevet i lemmaet nedenfor, og ville være krefter for et tredje ord, derfor skrivere. Bøyningsklassen til et primitivt ord, eller tilsvarende det sirkulære ordet som er knyttet til det ordet, kalles et aperodisk halskjede . Antall aperiodiske halskjeder med lengde , derfor er antall konjugasjonsklasser av primitive ord med lengde n på et alfabet med k bokstaver

.

Her er Möbius-funksjonen . Siden konjugatene til et primitivt ord alle er primitive og forskjellige, er antallet primitive ord med lengde n i et alfabet med k bokstaver

.

Funksjonene kalles også polynomene til krage (i variabelen ), og formelen tilskrives oberst Moreau . For følgende er oppfølgeren A001037 til OEIS . For og er de aperiodiske binære krager henholdsvis 001,011 og 0001,0011,0111.

Tallet er antall Lyndon-ord med lengde på bokstaver. Enhver klassekonjugasjon av et primitivt ord inneholder et enkelt element som er mindre enn det andre i en leksikografisk rekkefølge , og det er det eneste ordet Lyndon i klassen, slik at Lyndons ord danner et system av representanter for klassene med primitive ord eller aperiodiske halskjeder.

Lyndon og Schützenberger teorem

Eiendom 4  -  Hvis og er to forskjellige primitive ord, så er det et primitivt ord for alt . Dessuten er høyst et av ordene for ikke primitivt.

Den første delen av denne eiendommen er faktisk en omskrivning av setningen til Lyndon og Schützenberger som sier at hvis for , så og har samme rot. Dette gjelder ikke lenger hvis eller . Så for og ordet er et kvadrat. Den andre delen av uttalelsen sier at høyst et av ordene eller ikke er primitive. Hvis og er av samme lengde, er det eneste mulig ordet som er preget . For eksempel hvis og , da . Vi kan vise at hvis det er skrevet ut, generelt , med . Så, for og , vi har , og for , vi har .

Uten kant

Eiendom 5  -  Et ord er primitivt hvis og bare hvis et av konjugatene er et grenseløst ord.

En kant av et ord er et ord som både er et ordentlig prefiks og et ordentlig suffiks av . Et ord uten grense er et ord som ikke har en ikke-tom kant.

Demonstrasjon

Hvis ikke er primitiv, derfor av form for , så er det en kant av , og alle konjugatene til er krefter av et konjugat av , så alle har en kant.

Anta nå som er primitiv, og er den minste av konjugatene i en fast leksikografisk rekkefølge . Vi viser at det er grenseløst. Antag tvert imot at det har en kant . Så for nonempty, og er ikke tom ellers (og derfor ) er en firkant. Ordet er et konjugat av og derfor av . Hvis , da , derfor og er minst en kube av lemmaet nedenfor. Derfor i det minste , derfor også . Men da , og er et konjugat av mindre enn , motsier hypotesen.

Et lemma

Følgende resultat er nyttig i bevis på egenskapene til primitive ord:

Teorem  -  La og er to ord uten ord. Følgende forhold er ekvivalente:

  1. ,
  2. det er to heltall slik at ,
  3. det er et ord og to heltall som og .
Demonstrasjon

For å demonstrere at hvert ord har en unik rot, kan vi altså anta at et ord er skrevet på to måter som kraften til et primitivt ord, det vil si med og primitive ord. Etter tilstand (3) følger det at og , og som og er primitive, har vi og .

Språket til primitive ord

Det er tradisjonelt å skrive ned alle primitive ord på et fast alfabet. På et brev er det bare ett primitivt ord. På mer enn en bokstav er problemet med settets natur , innenfor rammen av teorien om formelle språk , stilt uten å være løst ennå (i 2016). Pál Dömösi og Masami Ito har viet en bok på mer enn 500 sider til dette spørsmålet. En gjennomgangsartikkel er av Gerhard Lischke.

Vi vet ikke om språket er algebraisk. Holger Petersen beviste i en artikkel publisert i 1996 at språket ikke er entydig algebraisk. Han bruker til det serien som genererer antall ord på k bokstaver som er skrevet

og er basert på Chomsky-Schützenberger-setningen, ifølge hvilken serien som genererer antall ord i et entydig algebraisk språk, er en algebraisk funksjon. For å vise at serien ikke er algebraisk, bruker han et av kriteriene utviklet av Philippe Flajolet .

De vanlige verktøyene for å bevise at et språk ikke er algebraisk, som Ogdens iterasjonslemma , eller andre iterasjonslemma som Bader og Mouras lemma eller til og med Ogdens utvekslingslemma , Winklmann og Ross, tillater ikke en konklusjon.

Språket til primitive ord er lukkingen av Lyndons ord ved sirkulær permutasjon . Hvis det var algebraisk, ville det være det samme siden algebraiske språk er stengt av sirkulær permutasjon. Det ble imidlertid vist av Berstel og Boasson at det ikke er algebraisk ved å anvende Ogdens lemma .

Språk er heller ikke lineært algebraisk , men det er et deterministisk kontekstuelt språk , det vil si anerkjent av en lineært avgrenset deterministisk automat . Når det gjelder kompleksiteten i gjenkjenning, er språket i klassen DTIME (n ^ 2), dvs. at det gjenkjennes av en deterministisk Turing-maskin i kvadratisk tid.

Morfisme som bevarer primitive ord

En morfisme av en fri halvgruppe til en annen fri halvgruppe bevarer de primitive ordene hvis bildet av et primitivt ord fremdeles er et primitivt ord.

Eksempler på morfismer som bevarer primitive ord er gitt av Lyndon-morfismer som per definisjon er morfismer som bevarer Lyndon-ord. En slik morphism bevarer også primitive ord: ja, hvis er en primitiv ord, det finnes et konjugat av som er en Lyndon ord; bildet av er ved hypotese et ord av Lyndon, derfor primitivt, og bildet av , som er et konjugert ord av , er derfor også et primitivt ord. En detaljert studie av morfer som bevarer primitive ord ble gjort av Viktor Mitrana. En lang versjon er tilgjengelig online. Hovedresultatet er en karakterisering av morfismene som bevarer de primitive ordene. For dette definerer vi begrepet ren kode . En kode med variabel lengde er en ren kode hvis for noe element av roten også er en del av . Vi kan vise at en kode er ren hvis og bare hvis det er et stjerneløst språk .

Proposisjon  -  En morfisme bevarer primitive ord hvis og bare hvis det er en ren kode.

Merknader og referanser

  1. Lothaire 1983 .
  2. Shallit 2009 .
  3. Lischke tilskriver dette resultatet til Huei-Jan Shyr og Shyr-Shen Yu, “  Ikke-primitive ord på språket  ”, Soochow J. Math. , vol.  20, n o  4,1994, s.  535–546.
  4. Othman Echi , “  Ikke-primitive ord med formen pq m  ”, RAIRO - Theoretical Informatics and Applications , vol.  51, n o  3,2017, s.  141-166 ( ISSN  0988-3754 , DOI  10.1051 / ita / 2017012 )
  5. Pál Dömösi og Masami Ito, kontekstfrie språk og primitive ord , World Scientific Publishing , 2014, 520  s. ( ISBN  978-981-4271-66-0 , OCLC  897020798 , online presentasjon )
  6. Det er spesielt kapittel 8 i boka, med tittelen Some Properties of the Language of Primitive Words , som studerer språkets algebraisitet.
  7. Gerhard Lischke, "  Primitive ord og røtter av ord  ", Acta Univ. Sapientiae, Informatica , vol.  3, n o  1, 2011, s.  5–34 ( arXiv  1104.442 ).
  8. Holger Petersen, “  On the Language of Primitive Words,  ” Theoretical Computer Science , vol.  161, n bein  1-2, 1996, s.  141-156 ( les online ).
  9. (i) Philippe Flajolet, "  Analytiske modeller og tvetydighet i kontekstfrie språk  " , Teoretisk. Beregn. Sci. , vol.  49,1987, s.  283-309 ( DOI  10.1016 / 0304-3975 (87) 90011-9 , les online ).
  10. Jean Berstel og Luc Boasson, “  The set of Lyndon words is not context-free  ”, Bulletin of the European Association for Theoretical Computer Science 63 (1997) , vol.  63, n o  1,1997, s.  139-140.
  11. Lischke 2011 .
  12. Noen ganger finner vi begrepet "primitiv morfisme" for en morfisme som bevarer primitive ord, men dette begrepet er nå ganske reservert, i ordkombinatorikk, for en morfisme hvis tilhørende matrise er primitiv.
  13. Gwénaël Richomme, “  Noen elementer i Word Combinatorics Cours 2014-2015  ” , Lirmm, 2014-2015 (konsultert 6. mai 2017 ) .
  14. Victor Mitrana, “  Primitive morphisms  ”, Information Processing Letters , vol.  64,1997, s.  277–281.
  15. Victor Mitrana, "  On morphisms preserving primitive words  " , TUCS Technical Report N ° 69 , Turku Center for Computer Science,November 1996( ISBN  951-650-895-2 , åpnet 6. mai 2017 ) .

Bibliografi

Relaterte artikler

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">