Word (matematikk)

I matematikk eller teoretisk datamaskin er et ord et resultat endelige elementer tatt i et sett . Det hele kalles alfabetet , dets deler kalles symboler eller bokstaver . De sier det er et trygt ord . $w$ $PÅ$ $PÅ$ $w$ $PÅ$

Eksempler

Et "binært ord". Det er et ord på et alfabet med to symboler, generelt bemerket og . For eksempel er den binære utviklingen av et naturlig tall, eller dets binære skrift, sekvensen av sifrene til dens representasjon i basen . Så, den binære skrivingen av "nitten" er . ${\ displaystyle 0}$ $1$ $2$ $10011$
En " deoksyribonukleinsyresekvens " (DNA). Det er et ord som vanligvis dannes av en serie på fire bokstaver som tilsvarer de fire nukleotidene som danner DNA-kjeden: A for "adenin", G for "guanin", T for "tymin", C for "cytosin".
Et " protein " er et makromolekyl som består av en kjede av aminosyrer . Det er 20 aminosyrer. Det er derfor et ord på et alfabet med 20 symboler.

Eiendommer

Ett ord skrives enklere: $w = (a_ {1}, a_ {2}, \ ldots, a_ {n})$ $w = a_ {1} a_ {2} \ cdots a_ {n}$

Den lengde av et ord er antallet posisjoner av de symboler som utgjør det: den ovennevnte ord er lengden . For eksempel er ordet på alfabetet lengde 7. Et ord kan være tomt. Det er ordet lengde 0. Det blir ofte notert ε. $w$ $ikke$ $abacaba$ $A = \ {a, b, c \}$

Den sammenkobling av to ord og er ordet oppnådd ved å sette ende mot ende og . For eksempel sammenkobling av og gir . Sammenkobling er en assosiativ operasjon, men ikke en kommutativ. Dens nøytrale element er ordet tomt. $u$ $v$ $uv$ $u$ $v$ $u = abraca$ $v = dabra$ $uv = abracadabra$

Ordsettet på et alfabet , utstyrt med sammenkoblingen, danner derfor en monoid . Som en algebraisk struktur er den en fri monoid i betydningen universell algebra . Dette betyr at ethvert ord er et produkt av sammenkobling av symbolene som komponerer det. $PÅ$

Ordsettet på et alfabet er tradisjonelt notert . $PÅ$ $A ^ {*}$

Ytterligere terminologi

De prefikser av et ord er ord iU ^ og , for . De 5 prefikser av ordet er: ε, , , og seg selv. Hvis vi ekskluderer det tomme ordet, snakker vi om et ikke-tomt prefiks , hvis vi ekskluderer selve ordet, snakker vi om et riktig prefiks . Tilsvarende er et ord et prefiks av et ord hvis det er et ord som . $w = a_ {1} \ cdots a_ {n}$ $n + 1$ $a_ {1} \ cdots a_ {i}$ $i = 1, \ ldots, n$
$abac$ $på$ $ab$ $aba$ $abac$ $s$ $w$ $s$ $w = ps$

De suffikser av et ord er ord iU ^ og , for . Den fem suffiks av ordet er: ord , , , og ε. Tilsvarende er et ord et suffiks av et ord hvis det er et ord som . $w = a_ {1} \ cdots a_ {n}$ $n + 1$ $a _ {{i}} \ cdots a_ {n}$ $i = 1, \ ldots, n$
$abac$ $abac$ $bac$ $ac$ $vs.$ $s$ $w$ $s$ $w = ps$

De faktorene av et ord er ordene , for . De faktorer av ordet er det ord ε, , , , , , , , og . Tilsvarende er et ord en faktor av et ord hvis det er ord som . $w = a_ {1} \ cdots a_ {n}$ $a_ {i} \ cdots a_ {j}$ $1 \ leq i \ leq j \ leq n$
$abac$ $på$ $b$ $vs.$ $ab$ $ba$ $ac$ $aba$ $bac$ $abac$ $x$ $w$ $p, s$ $w = pxs$

Et ord er et stikkord til et ord hvis det er en faktorisering i ord som . Dermed oppnås ved å slette symboler i . For eksempel er underordet til . $x$ $y$ $y = z_ {0} x_ {1} z_ {1} x_ {2} \ cdots x_ {n} z_ {n}$ $z_ {0}, x_ {1}, z_ {1}, x_ {2}, \ ldots, x_ {n}, z_ {n}$ $x = x_ {1} x_ {2} \ cdots x_ {n}$
$x$ $y$ $y$ $aa$ $abac$

Den speilbilde eller retur av et ord er ordet . For eksempel er ordets speilbilde . $w = a_ {1} \ cdots a_ {n}$ ${\ tilde w} = a_ {n} \ cdots a_ {1}$
$abac$ $caba$

En palindrom er et ord som er lik speilbildet.
For eksempel er ordet et palindrom. $abacaba$

Et ord er et heltall av et ord hvis det er et positivt heltall som ( gjentatte ganger). $x$ $y$ $ikke$ $x = y ^ {n}$ $y$ $ikke$

Et ord er primitivt hvis det ikke er hele kraften til et annet ord.
For eksempel er ordet ikke primitivt, fordi det er kvadratet av ordet . $sukkertøy$ $Vi vil$

To ord og er konjugert hvis det er ord og slik som og . For eksempel ordene og er konjugert. Konjugasjon er en ekvivalensrelasjon . $x$ $y$ $s$ $s$ $x = ps$ $y = sp$
$abaab$ $abeba$

En konjugasjonsklasse eller sirkulært ord eller krage er settet med konjugater av et ord.
Noen ganger bemerkes et sirkulært ord av representant . For eksempel består konjugasjonsklassen av av de fem ordene . $x$ $(x)$ $abaab$ $abaab, baaba, aabab, ababa, babaa$

En periode av et ord , hvor er symboler, er et heltall med slik at for . For eksempel har ordet punktene 5, 7 og 8. $x = a_1a_2 \ cdots a_n$ $a_1, a_2, \ ldots, a_n$ $s$ $1 \ le p \ le n$ $a_ {i} = a _ {{i + p}}$ $i = 1, \ ldots, np$
$abaababa$

Et periodisk ord er et ord hvis lengde er minst to ganger minimumsperioden. Et kvadrat , det vil si et ord av formen, er periodisk. Ordet er periodisk mens ordet ikke er det. $uu$ $aababaababa = (aababa) ^ 2a$ $abaababa$

En kant av et ord er et ord som både er et ordentlig prefiks og et ordentlig suffiks av . For eksempel er kantene på ordet det tomme ordet, og . Hvis er en kant av et ord , så er en periode på . Et ord uten kantlinje er et ord hvis eneste kantlinje er det tomme ordet. Det er et ord hvis eneste periode er lengden. $x$ $y$ $x$
$abaababa$ $a, aba$ $y$ $x$ $| x | - | y |$ $x$

Den blanding produkt ш av to ord og er settet av ord , hvor den og les er ord, som for eksempel og . For eksempel ш . $x$ $y$ $x$ $y$ $x_1y_1x_2y_2 \ cdots x_ny_n$ $x_ {i}$ $y_i$ $x = x_1x_2 \ prikker x_n$ $y = y_1y_2 \ prikker y_n$
$ab$ $ab = \ {aabb, abab \}$

Den leksikografiske rekkefølgen på ordene er definert med utgangspunkt i en total rekkefølge på alfabetet. Det er den alfabetiske rekkefølgen, formelt gitt av hvis og bare hvis er prefikset til eller hvis , og for ord og symboler og med . For eksempel, for alfabetet som er dannet av og med , har vi . $x \ leq y$ $x$ $y$ $x = zax '$ $y = zby '$ $z, x ', y'$ $på$ $b$ $a <b$ ${\ displaystyle 0}$ $1$ $0 <1$ $\ varepsilon <0 <00 <000 <01 <1 <10 \ cdots$

Lemma fra Levi

Lemma Levi - Let , , , ord. Hvis , så finnes det et ord som , eller , . $x$ $y$ $x '$ $y '$ $xy = x'y '$ $z$ $x = x'z$ $y '= zy$ $x '= xz$ $y = zy '$

En annen måte å uttrykke dette resultatet på er å si at hvis og begge er prefikser av et ord, så er prefikset til eller er prefikset til . $x$ $x '$ $x$ $x '$ $x '$ $x$

Et grunnleggende resultat

Følgende resultat karakteriserer ordene som pendler.

Teorem - La være to ord som ikke er imøtekommende. Følgende forhold er ekvivalente: $x$ $y$

$xy = yx$ ,
det er to heltall slik at , $n, m \ ge1$ $x ^ n = y ^ m$
det er et ord og to heltall som og . $z$ $p, q \ ge1$ $x = z ^ {p}$ $y = z ^ {q}$

Blant konsekvensene er:

Hvert ord er kraften til et enkelt primitivt ord.
Bøyningene til et primitivt ord er i seg selv primitive.
Bøyningsklassen til et primitivt ord av lengde har elementer. $ikke$ $ikke$

Teoremet innrømmer en sterkere versjon:

Hvis og er to ikke-ordløse ord, og hvis det er noen ikke-triviell sammenheng mellom og , det vil si hvis det er en sammenheng $x$ $y$ $x$ $y$

z_ {1} z_ {2} \ cdots z_ {n} = z '_ {1} z' _ {2} \ cdots z '_ {m}

hvor er enten eller og $z_ {1}, z_ {2}, \ ldots, z_ {n}, z '_ {1}, z' _ {2}, \ ldots, z '_ {m}$ $x$ $y$

$z_ {1} \ neq z '_ {1}$ , da . $xy = yx$

Vi kan uttrykke disse resultatene i form av en ligning mellom ord : den første sier at ligningen

XY = YX

i de ukjente har bare sykliske løsninger , det vil si hvor alle ordene er krefter for det samme ordet; den andre sier at enhver ligning i to variabler uten konstant bare har sykliske løsninger. $X, Y$

En annen eiendom gjelder konjugasjon.

Teorem - La være ord uten ord. Så $X Y Z$

{\ displaystyle xy = yz}

hvis og bare hvis det er et ord uten ord, et ord og et heltall som $u$ $v$ ${\ displaystyle e \ geq 0}$

{\ displaystyle x = uv, z = vu}

, og .

{\ displaystyle y = (uv) ^ {e} u = u (sett) ^ {e}}

Dette resultatet tilskrives noen ganger Lyndon og Schützenberger . Vi kan se denne påstanden som en beskrivelse av løsningene i ligningen

{\ displaystyle XY = YZ}

i tre variabler . $X Y Z$

Morfisme

En søknad

h: A ^ {*} \ til B ^ {*}

er en morfisme eller en homomorfisme hvis den tilfredsstiller

h (xy) = h (x) h (y)

for alle ord . Enhver morfisme bestemmes av dens data på bokstavene i alfabetet . Faktisk, for et ord , det har vi $x, y \ i A ^ *$ $PÅ$ $w = a_ {1} a_ {2} \ cdots a_ {n}$

h (w) = h (a_ {1}) h (a_ {2}) \ cdots h (a_ {n})

I tillegg er bildet av det tomme ordet det tomme ordet:

h (\ varepsilon) = \ varepsilon

fordi er det eneste ordet som er lik kvadratet, og $\ varepsilon$

h (\ varepsilon) = h (\ varepsilon \ varepsilon) = h (\ varepsilon) h (\ varepsilon)

Eksempler

Den Thue-Morse morphism gjør det mulig å definere den Prouhet-Thue-Morse sekvens . Det er morphism løpet definert av $\ mu: A ^ {*} \ til A ^ {*}$ $A = \ {0.1 \}$

\ mu (0) = 01

\ mu (1) = 10

Ved å itere, får vi

\ mu (01) = 0110

\ mu (0110) = 01101001

\ mu (01101001) = 0110100110010110

Den Fibonacci morphism definerer Fibonacci ord . Det er morfismen , med , definert av $\ phi: A ^ {*} \ til A ^ {*}$ $A = \ {a, b \}$

\ phi (a) = ab

\ phi (b) = a

Ved å itere, får vi

\ phi (ab) = aba

\ phi (aba) = abaab

\ phi (abaab) = abaababa

Spesielle morfismer

En automorfisme er en sammenheng hvis og bare bildet av et symbol er et symbol. $h: A ^ {*} \ til A ^ {*}$
En morphism er ikke-slette hvis bildet av et symbol er aldri tomt ord. Det tilsvarer å si at bildet av et ord alltid er minst like langt som startordet . Vi sier også ikke-avtagende morfisme , eller øker i vid forstand . Vi sier også at det er en morfisme av halvgrupper siden begrensningen til halvgruppen er med verdier i . $h$ $| h (w) | \ geq | w |$ ${\ displaystyle A ^ {+} = A ^ {*} \ setminus \ varepsilon}$ ${\ displaystyle B ^ {+}}$
En morfisme er alfabetisk hvis bildet av et symbol er et symbol eller det tomme ordet. Det tilsvarer å si at bildet av et ord alltid er kortere enn startordet.
En morfisme er bokstavelig eller bokstav til bokstav eller bevarer lengden hvis bildet av et symbol er et symbol. Det tilsvarer å si at bildet av et ord har samme lengde som startordet.
En morfisme er ensartet hvis bildene av symbolene alle har samme lengde. Hvis den vanlige lengden er , sa også at morfismen er - uniform . Thue-Morse morfismen er 2-uniform; Fibonacci-morfismen slettes ikke, og er ikke ensartet. En bokstavelig morfisme er 1-uniform. $h$ $k$ $k$
En morfisme er symmetrisk hvis det er en sirkulær permutasjon av alfabetet som pendler med , dvs. slik at $h: A ^ {*} \ til A ^ {*}$ $s: A \ til A$ $h$ $h (s (a)) = s (h (a))$ for ethvert symbol . Her utvides til en automorfisme av . Denne formelen antyder at det er ensartet. Thue-Morse morfismen er symmetrisk. $på$ $s$ $A ^ {*}$ $h$

Merknader og referanser

Referanser

I engelskspråklig litteratur sier vi underord for faktor og spredt underord for underord.
Symbolet "ш" er bokstaven sha i det kyrilliske alfabetet . Unicode- tegnet U + 29E2 (SHUFFLE PRODUCT)) brukes også. I en matematisk formel kan vi også bruke \ text {ш}.
For å forstå dette eksemplet, la oss skrive bokstavene i det andre ordet med store bokstaver. Med denne konvensjonen har vi gjort det $ab$ ш $AB = \ {abAB, aAbB, AabB, aABb, AaBb, ABab \}$ og når vi kommer tilbake til små bokstaver, er det bare de to angitte ordene som er igjen.
Denne uttalelsen er faktisk den enkle delen. Det er en omvendt: hvis en monoid tilfredsstiller konklusjonen av lemmaet, og hvis det dessuten eksisterer en morfisme av i additivet monoid av naturlige heltall slik at , er M gratis (se Lothaire (1983), Oppgave 1.1.1). $M$ $\ lambda$ $M$ $\ lambda ^ {{- 1}} (0) = 1$
For eksempel i 2009 Shallit lærebok , 2.3 teoremer av Lyndon - Schützenberger.
Denne terminologien brukes av (i) Anna E. Frid , " Arithmetical complexity of the symmetric D0L words " , Theoretical Computer Science , vol. 306,2003, s. 535-542.

Relaterte artikler

Bibliografi

Jean-Michel Autebert, algebraiske språk , Masson,1987, 278 s. ( ISBN 978-2-225-81087-9 )
Olivier Carton, Formelle språk, beregningsevne og kompleksitet: bachelor- og mastergrad i matematikk eller informatikk, informatikk alternativ for aggregering av matematikk , Paris, Vuibert ,2008, 237 s. ( ISBN 978-2-7117-2077-4 )
Maxime Crochemore , Christophe Hancart og Thierry Lecroq, Algorithmique du texte , Paris, Vuibert ,2004, 347 s. ( ISBN 2-7117-8628-5 )
(en) M. Lothaire, Combinatorics on Words , vol. 17, Addison-Wesley Publishing Co., Reading, Mass.,1983, 238 s. ( ISBN 978-0-201-13516-9 , online presentasjon )- En annen, revidert utgave dukket opp av Cambridge University Press , i Cambridge Mathematical Library-samlingen, i 1997, ( ISBN 978-0521599245 ) .
(en) Jeffrey Shallit, et andre kurs i formelle språk og automatteori , Cambridge University Press ,2009, 240 s. ( ISBN 978-0-521-86572-2 )