Teorema de Dirichlet sobre progressões aritméticas

Johann Peter Gustav Lejeune Dirichlet.

O teorema de Dirichlet sobre progressões aritméticas é um resultado da teoria analítica dos números demonstrado pelo matemático Johann Dirichlet.

Este teorema sobre a distribuição dos números primos em N {\displaystyle \mathbb {N} } , foi conjecturado por Gauss e finalmente demonstrado em 1837 por Dirichlet, nome pelo qual é atualmente conhecido.

O primeiro teorema de convergência de séries de Fourier, devido a Dirichlet, apareceu em 1829 e se refere à funções monótonas em trechos. Por ele começamos primeiro com uns comentários sobre estas funções. Uma função monótona e cotada em um intervalo [a, b] é integrável e tem limites laterais finitos em cada ponto. Se estes limites não coincidem a função terá uma descontinuidade com um salto finito. A soma dos saltos não pode ser maior que a diferença dos valores da função nos extremos do intervalo, de modo que o conjunto de descontinuidades com salto maior que 1/n é finito e, portanto, o conjunto de descontinuidades é no máximo numerável. As mesmas propriedades serão certas para uma função monótona em trechos, ou seja, aquela que é monótona em uma quantidade finita de intervalos que unidos dão o intervalo original.

Enunciado

Seja a 1 , b N / mdc ( a 1 , b ) = 1 {\displaystyle a_{1},\,b\in \mathbb {N} \;/\;\operatorname {mdc} (a_{1},\;b)=1} então a progressão aritmética a n = a 1 + b ( n 1 ) {\displaystyle a_{n}=a_{1}+b\cdot (n-1)} contém infinitos números primos. (conforme Dirichlet)

Demonstração

A demonstração do teorema utiliza as propriedades de certas funções multiplicativas (conhecidas como funções L de Dirichlet) e vários resultados sobre aritmética de números complexos e é suficientemente complexa para que alguns textos clássicos de teoria dos números decidam excluí-la de seu repertório de demonstrações. Para evitar fazer uma leitura demasiado densa, neste artigo se excluiu da demostração alguns corolários intermediários que aparecem marcados como [AD]. A demostração completa, junto com os corolários excluídos aqui, podem ser encontrados no artigo de González de la Hoz.[1]

Seja G {\displaystyle G} um grupo comutativo finito de ordem h {\displaystyle h} e elemento unitário e {\displaystyle e} .

Um caráter sobre G {\displaystyle G} é uma função χ C / χ 0 , χ ( u v ) = χ ( u ) χ ( v ) u , v G {\displaystyle \chi \in \mathbb {C} \;/\;\chi \neq 0,\;\chi (u\cdot v)=\chi (u)\cdot \chi (v)\;\forall u,v\in G} Um caráter sobre G {\displaystyle G} tem uma série de propriedades importantes para nossa demonstração:

  1. Dado que tanto a inversa de um caráter sobre G {\displaystyle G} como o produto dos caráteres sobre G {\displaystyle G} é também um caráter sobre G {\displaystyle G} , o conjunto de caráteres sobre G {\displaystyle G} forma um grupo comutativo com a multiplicação.
    Isto permite definir o caráter principal do grupo G {\displaystyle G} que se define como a função χ 0 / χ 0 ( u ) = 1 u G {\displaystyle \chi _{0}\;/\;\chi _{0}(u)=1\;\forall u\in G} . O caráter principal é portanto o elemento unidade do grupo definido pelo conjunto de caráteres sobre G {\displaystyle G} .
  2. Como χ ( e ) = 1 {\displaystyle \chi (e)=1} e dado que a ordem de um elemento divide a ordem do grupo, então u G ( χ ( u ) ) h = χ ( u h ) = χ ( e ) = 1 {\displaystyle \forall u\in G\;(\chi (u))^{h}=\chi (u^{h})=\chi (e)=1} , o que implica que χ ( u ) ∣= 1 {\displaystyle \mid \chi (u)\mid =1} .
    Dado que o número de raizes do elemento unitário de ordem h {\displaystyle h} é como máximo h {\displaystyle h} , o número de carateres c {\displaystyle c} é finito, sendo o valor h h {\displaystyle h^{h}} uma cota superior de c {\displaystyle c} .
    Por outra parte u G , u e {\displaystyle \forall u\in G,\;u\neq e} existe um caráter χ / χ ( u ) 1 {\displaystyle \chi \;/\;\chi (u)\neq 1} ([AD]). Por ele, e se representa mediante G a χ {\displaystyle \sum _{G}a_{\chi }\,} a soma do valor a χ {\displaystyle a_{\chi }} associado a cada um dos diferentes caráteres do grupo G {\displaystyle G} , se tem estas propriedades adicionais ([AD]):
  3. u G  se tem que:  {\displaystyle \forall u\in G{\mbox{ se tem que: }}} G χ ( u ) = { c s i u = e 0 s i u e {\displaystyle \sum _{G}\chi (u)={\begin{cases}c&si\;u=e\\0&si\;u\neq e\end{cases}}}  onde  c = G 1 {\displaystyle \quad {\mbox{ onde }}c=\sum _{G}1}
  4. u G  se tem que:  {\displaystyle \forall u\in G{\mbox{ se tem que: }}} u G χ ( u ) = { h s i χ = χ 0 0 s i χ χ 0 {\displaystyle \sum _{u\in G}\chi (u)={\begin{cases}h&si\;\chi =\chi _{0}\\0&si\;\chi \neq \chi _{0}\end{cases}}}  onde  h  é a ordem de  G  sendo  c = h {\displaystyle \quad {\mbox{ onde }}h{\mbox{ é a ordem de }}G{\mbox{ sendo }}c=h}
  5. u , v G  determina que:  {\displaystyle \forall u,v\in G{\mbox{ determina que: }}} 1 h χ χ ( u ) χ ( v ) = { 1 s i u = v 0 s i u v {\displaystyle {\frac {1}{h}}\sum _{\chi }{\frac {\chi (u)}{\chi (v)}}={\begin{cases}1&si\;u=v\\0&si\;u\neq v\end{cases}}}
  6. χ 1 , χ 2 G  determina que:  {\displaystyle \forall \chi _{1},\chi _{2}\in G{\mbox{ determina que: }}} 1 h u G χ 1 ( u ) χ 2 ( u ) = { 1 s i χ 1 = χ 2 0 s i χ 1 χ 2 {\displaystyle {\frac {1}{h}}\sum _{u\in G}{\frac {\chi _{1}(u)}{\chi _{2}(u)}}={\begin{cases}1&si\;\chi _{1}=\chi _{2}\\0&si\;\chi _{1}\neq \chi _{2}\end{cases}}}
    Dado um q N {\displaystyle q\in \mathbb {N} } , se definem os carateres χ {\displaystyle \chi } do grupo G = Z q {\displaystyle G=Z_{q}^{*}} definido como as classes de congruência módulo q {\displaystyle q} de números coprimos com q {\displaystyle q} .
    O grupo G {\displaystyle G} tem ϕ ( q ) {\displaystyle \phi (q)} elementos, e o podemos representar por G = { a 1 , a 2 , a 3 , . . . , a ϕ ( q ) } {\displaystyle G=\lbrace a_{1},a_{2},a_{3},...,a_{\phi (q)}\rbrace } onde os diferentes a i {\displaystyle a_{i}} são os representantes da classe de congruência que obedecem a condição 0 < a j < q {\displaystyle 0<a_{j}<q} , e neste contexto se definem as funções estendidas dos caracteres χ {\displaystyle \chi } de G {\displaystyle G} da seguinte maneira:
    χ ( n ) = { χ ( a i ) s i n a i ( mod q ) 0 s i mcd ( n , q ) > 1 {\displaystyle \chi (n)={\begin{cases}\chi (a_{i})&\mathrm {si} \;n\equiv a_{i}{\pmod {q}}\\0&\mathrm {si} \;\operatorname {mcd} (n,q)>1\end{cases}}}
    Estas funções se denominam caracteres de Dirichlet módulo q e são completamente multiplicativas. Existem ϕ ( q ) {\displaystyle \phi (q)} funções deste tipo e uma delas: χ 0 ( n ) = { 1 s i n a i ( mod q ) 0 s i mcd ( n , q ) > 1 {\displaystyle \chi _{0}(n)={\begin{cases}1&\mathrm {si} \;n\equiv a_{i}{\pmod {q}}\\0&\mathrm {si} \;\operatorname {mcd} (n,q)>1\end{cases}}} se denomina caráter principal de Dirichlet.
    Estes carateres tem algumas propriedades significativas (derivadas das propriedades dos carateres de um grupo que vimos antes):
  7. n ( m o d q ) χ ( n ) = { ϕ ( q ) s i χ = χ 0 0 s i χ χ 0 {\displaystyle \sum _{n(\mathrm {\;mod\;} q)}\chi (n)={\begin{cases}\phi (q)&\mathrm {si} \;\chi =\chi _{0}\\0&\mathrm {si} \;\chi \neq \chi _{0}\end{cases}}}
  8. n ( m o d q ) χ ( u ) = { ϕ ( q ) s i u 1 ( mod q ) 0 s i u 1 ( mod q ) {\displaystyle \sum _{n(\mathrm {\;mod\;} q)}\chi (u)={\begin{cases}\phi (q)&\mathrm {si} \;u\equiv 1{\pmod {q}}\\0&\mathrm {si} \;u\not \equiv 1{\pmod {q}}\end{cases}}}
  9. a N / mcd ( a , q ) = 1  se tem que:  {\displaystyle \forall a\in \mathbb {N} \;/\;\operatorname {mcd} (a,\;q)=1{\mbox{ se tem que: }}} n ( m o d q ) χ ( u ) χ ( a ) = { ϕ ( q ) s i u = a 0 s i u a {\displaystyle \sum _{n(\mathrm {\;mod\;} q)}{\frac {\chi (u)}{\chi (a)}}={\begin{cases}\phi (q)&\mathrm {si} \;u=a\\0&\mathrm {si} \;u\neq a\end{cases}}}

Neste ponto se deve introduzir o seguinte definição:

Uma função-L de Dirichlet é uma função da forma

L ( s , χ ) = n = 1 χ ( n ) n s {\displaystyle L(s,\chi )=\sum _{n=1}^{\infty }{\frac {\chi (n)}{n^{s}}}} onde s C {\displaystyle s\in \mathbb {C} } e χ {\displaystyle \chi } é um caráter de Dirichlet.

Os valores de χ {\displaystyle \chi } são periódicos, o que implica que a série L ( s , χ ) {\displaystyle L(s,\,\chi )} converge absolutamente para ( s ) > 1 {\displaystyle \Re (s)>1} e uniformemente para ( s ) > 1 + ε , ε > 0. {\displaystyle \Re (s)>1+\varepsilon ,\quad \forall \varepsilon >0.} Além disso, como os coeficientes são completamente multiplicativos, a série admite a seguinte expressão: L ( s , χ ) = p ( 1 χ ( p ) p s ) 1 {\displaystyle L(s,\chi )=\prod _{p}\left(1-{\frac {\chi (p)}{p^{s}}}\right)^{-1}} Quando ( s ) > 1 {\displaystyle \Re (s)>1} A função-L de Dirichlet tem as seguintes propriedades ([AD]):

  1. L ( s , χ ) 0 {\displaystyle L(s,\chi )\neq 0}
  2. L ( s , χ 0 ) = ζ ( s ) p q ( 1 1 p s ) {\displaystyle L(s,\chi _{0})=\zeta (s)\cdot \prod _{p\mid q}\left(1-{\frac {1}{p^{s}}}\right)}
  3. L ( s , χ ) L ( s , χ ) = n = 1 χ ( n ) Λ ( n ) n s {\displaystyle {\frac {L^{\prime }(s,\chi )}{L(s,\chi )}}=-\sum _{n=1}^{\infty }{\frac {\chi (n)\Lambda (n)}{n^{s}}}}
  4. ln ( L ( s , χ ) ) = p m = 1 1 m ( χ ( p ) ) m p m s {\displaystyle \ln(L(s,\chi ))=\sum _{p}{\sum _{m=1}^{\infty }{\frac {1}{m}}{\frac {(\chi (p))^{m}}{p^{m\cdot s}}}}}

Da igualdade L ( s , χ 0 ) = ζ ( s ) p q ( 1 1 p s ) {\displaystyle L(s,\chi _{0})=\zeta (s)\cdot \prod _{p\mid q}\left(1-{\frac {1}{p^{s}}}\right)} e as propriedades da função ζ {\displaystyle \zeta } se deduz que a função L ( s , χ 0 ) {\displaystyle L(s,\chi _{0})} é analítica no semiplano complexo ( s ) > 0 {\displaystyle \Re (s)>0} a exceção de um polo em s = 1 {\displaystyle s=1} , cujo resíduo é p q ( 1 1 p ) = ϕ ( q ) q {\displaystyle \prod _{p\mid q}\left(1-{\frac {1}{p}}\right)={\frac {\phi (q)}{q}}} . Como consequência disto, podemos afirmar que L ( s , χ 0 ) = f ( s ) + ϕ ( q ) / q s 1 {\displaystyle L(s,\chi _{0})=f(s)+{\frac {\phi (q)/q}{s-1}}} , onde f {\displaystyle f} é analítica e não tem singularidades em ( s ) > 0 {\displaystyle \Re (s)>0} , de modo que a função expressa por L ( s , χ ) L ( s , χ ) = f ( s ) ϕ ( q ) / q ( s 1 ) 2 f ( s ) + ϕ ( q ) / q s 1 = ( s 1 ) 2 f ( s ) ϕ ( q ) / q ( s 1 ) f ( s ) ϕ ( q ) / q 1 s 1 {\displaystyle {\frac {L^{\prime }(s,\chi )}{L(s,\chi )}}={\frac {f^{\prime }(s)-{\frac {\phi (q)/q}{(s-1)^{2}}}}{f(s)+{\frac {\phi (q)/q}{s-1}}}}={\frac {(s-1)^{2}f^{\prime }(s)-\phi (q)/q}{(s-1)f(s)-\phi (q)/q}}{\frac {1}{s-1}}} tem também um polo em s = 1 {\displaystyle s=1} com resíduo 1 {\displaystyle -1} . Por outra parte, toda função-L de Dirichlet L ( s , χ ) {\displaystyle L(s,\chi )} com χ χ 0 {\displaystyle \chi \neq \chi _{0}} é analítica e não apresenta singularidades na zona ( s ) > 0 {\displaystyle \Re (s)>0} ([AD]). E para k > 0 {\displaystyle k>0} se tem ([AD]) que p = a ( mod q ) ln ( p ) p k = n = a ( mod q ) Λ ( n ) n k O ( 1 ) {\displaystyle \sum _{p=a{\pmod {q}}}{\frac {\ln(p)}{p^{k}}}=\sum _{n=a{\pmod {q}}}{\frac {\Lambda (n)}{n^{k}}}-O(1)} o qual também se pode expressar como:

p = a ( mod q ) ln ( p ) p k = {\displaystyle \sum _{p=a{\pmod {q}}}{\frac {\ln(p)}{p^{k}}}=} 1 ϕ ( q ) L ( k , χ 0 ) L ( k , χ 0 ) 1 ϕ ( q ) χ ( a ) χ ( mod q ) χ χ 0 L ( k , χ ) L ( k , χ ) O ( 1 ) {\displaystyle {\frac {-1}{\phi (q)}}\cdot {\frac {L^{\prime }(k,\chi _{0})}{L(k,\chi _{0})}}-{\frac {1}{\phi (q)\chi (a)}}\sum _{\chi {\pmod {q}} \atop \chi \neq \chi _{0}}{\frac {L^{\prime }(k,\chi )}{L(k,\chi )}}-O(1)}

Esta expressão é chave para a demonstração do teorema de Dirichlet, pois podemos concluir que o teorema é correto se o primeiro termo do segundo membro diverge quando os restantes termos permanecem dentro de uns limites. Como se obedece que L ( 1 , χ ) 0 {\displaystyle L(1,\chi )\neq 0} quando χ χ 0 {\displaystyle \chi \neq \chi _{0}} a seguinte expressão:

lim k 1 + 1 ϕ ( q ) χ ( a ) χ ( mod q ) χ χ 0 L ( k , χ ) L ( k , χ ) = 1 ϕ ( q ) χ ( 1 ) χ ( mod q ) χ χ 0 L ( 1 , χ ) L ( 1 , χ ) = O ( 2 ) {\displaystyle \lim _{k\rightarrow 1^{+}}{\frac {1}{\phi (q)\chi (a)}}\sum _{\chi {\pmod {q}} \atop \chi \neq \chi _{0}}{\frac {L^{\prime }(k,\chi )}{L(k,\chi )}}={\frac {1}{\phi (q)\chi (1)}}\sum _{\chi {\pmod {q}} \atop \chi \neq \chi _{0}}{\frac {L^{\prime }(1,\chi )}{L(1,\chi )}}=O(2)}

obtem um valor finito e, como vimos, dado que 1 χ 0 ( a ) L ( k , χ 0 ) L ( k , χ 0 ) = L ( k , χ 0 ) L ( k , χ 0 ) {\displaystyle {\frac {1}{\chi _{0}(a)}}{\frac {L^{\prime }(k,\chi _{0})}{L(k,\chi _{0})}}={\frac {L^{\prime }(k,\chi _{0})}{L(k,\chi _{0})}}} tem um polo em s = 1 {\displaystyle s=1} com resíduo 1 {\displaystyle -1} resulta que lim k 1 + L ( k , χ 0 ) L ( k , χ 0 ) = {\displaystyle \lim _{k\rightarrow 1^{+}}{\frac {L^{\prime }(k,\chi _{0})}{L(k,\chi _{0})}}=-\infty } o que implica que:

p = a ( mod q ) ln ( p ) p = {\displaystyle \sum _{p=a{\pmod {q}}}{\frac {\ln(p)}{p}}=} lim k 1 + p = a ( mod q ) ln ( p ) p k = {\displaystyle \lim _{k\rightarrow 1^{+}}\sum _{p=a{\pmod {q}}}{\frac {\ln(p)}{p^{k}}}=} 1 ϕ ( q ) ( lim k 1 + L ( k , χ 0 ) L ( k , χ 0 ) + O ( 2 ) ) + O ( 1 ) = {\displaystyle {\frac {-1}{\phi (q)}}\left(\lim _{k\rightarrow 1^{+}}{\frac {L^{\prime }(k,\chi _{0})}{L(k,\chi _{0})}}+O(2)\right)+O(1)=} {\displaystyle \infty }

o que prova o teorema.

Ver também

  • Teorema de Green-Tao

Referências

  1. Gonzalez de la Hoz, F.A., Demostración del teorema de Dirichlet, web de la UNED. (em castelhano)