Wikipédia Discussão:Dicionário/pt-PT: diferenças entre revisões

O conteúdo da página não é suportado noutras línguas.
Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
→‎fato: facto: Agora é possível definir dicionários locais para certos artigos, como neste exemplo: [https://secure.wikimedia.org/wikipedia/pt/w/index.php?diff=next&oldid=23022476]
(Há uma edição intermédia do mesmo utilizador que não está a ser apresentada)
Linha 140: Linha 140:
:Embora a sintaxe <nowiki>-{}-</nowiki> seja só do conversor do próprio MediaWiki, o script do Wikisource também permite que sejam feitos dicionários locais em artigos. É só copiar a [[s:Predefinição:Modernização automática]], provavelmente para um nome melhor, e mudar o <code>id</code> para "conv-idiomas". Eu ia sugerir {{tl|Converter}}, já que existe a {{tl|Não converter}}, mas infelizmente já está em uso. Então que tal {{tl|Conversão}}?
:Embora a sintaxe <nowiki>-{}-</nowiki> seja só do conversor do próprio MediaWiki, o script do Wikisource também permite que sejam feitos dicionários locais em artigos. É só copiar a [[s:Predefinição:Modernização automática]], provavelmente para um nome melhor, e mudar o <code>id</code> para "conv-idiomas". Eu ia sugerir {{tl|Converter}}, já que existe a {{tl|Não converter}}, mas infelizmente já está em uso. Então que tal {{tl|Conversão}}?
:Uma vez criada, podem também ser feitas predefinições para guardar dicionários locais comuns a artigos de determinado grupo, de modo que não seja preciso colocar as mesmas regras em vários artigos. Por exemplo, se "mouse: rato" e "arquivo: ficheiro" costumam ser conversões válidas em um mesmo grupo de artigos (geralmente de ''informática''), tais conversões poderiam ser colocada em uma só predefinição que serviria para guardar o dicionário local usado pelo grupo dos artigos em que elas sejam válidas. (tudo bem que "arquivo: ficheiro" parece ser válido sempre, mas serve para dar um exemplo do que os chineses fazem para lidar com essas variações regionais que nem sempre podem ir para as tabelas globais). [[b:pt:User:Helder.wiki|Helder]] 02h08min de 4 de abril de 2011 (UTC)
:Uma vez criada, podem também ser feitas predefinições para guardar dicionários locais comuns a artigos de determinado grupo, de modo que não seja preciso colocar as mesmas regras em vários artigos. Por exemplo, se "mouse: rato" e "arquivo: ficheiro" costumam ser conversões válidas em um mesmo grupo de artigos (geralmente de ''informática''), tais conversões poderiam ser colocada em uma só predefinição que serviria para guardar o dicionário local usado pelo grupo dos artigos em que elas sejam válidas. (tudo bem que "arquivo: ficheiro" parece ser válido sempre, mas serve para dar um exemplo do que os chineses fazem para lidar com essas variações regionais que nem sempre podem ir para as tabelas globais). [[b:pt:User:Helder.wiki|Helder]] 02h08min de 4 de abril de 2011 (UTC)
::Criei a [[Predefinição:Conversão]] a partir da [[wikisource:Predefinição:Modernização automática]]. Agora é possível definir dicionários locais para certos artigos, como [https://secure.wikimedia.org/wikipedia/pt/w/index.php?diff=next&oldid=23022476 neste exemplo]. [[b:pt:User:Helder.wiki|Helder]] 16h30min de 29 de junho de 2011 (UTC)

Revisão das 16h50min de 29 de junho de 2011

AO1990

Em Portugal está em vigor o AO1990. Por isso dever-se-ia ativar a tabela de conversão AO1990 e desativar a de 1945. Dreispt (discussão) 16h00min de 30 de dezembro de 2010 (UTC)[responder]

Para quem não acompanhou, houve também alguns comentários sobre isso nesta outra discussão.
As regras foram "ativadas" (ou melhor, foram colocadas com a sintaxe que o script entende, que é "* palavra: outra palavra//comentário opcional". Trocar "*" por ":" acaba servindo como uma forma de desativar certas regras quando isso é necessário).
Assim que for atualizada a cache (não sei se é do MediaWiki ou do navegador, elas deverão funcionar como as demais). Helder 22h03min de 30 de dezembro de 2010 (UTC)[responder]
Penso que precisa "desativar" as regras do AO1945, pois estão a ser indicadas regras contraditórias. Ex: AO1945: acionar=>accionar; e ao mesmo tempo temos AO1990 accionar=>acionar. Dreispt (discussão) 08h28min de 31 de dezembro de 2010 (UTC)[responder]
Sim, sim, eu só fiz a parte que pareceu mais rápida... Eu usei uma ferramenta para fazer operações sobre conjuntos e obtive a interseção (das expressões que ficam no lado esquerdo) das regras das duas seções. Mas concordo que ainda é preciso olhar as outras também... Quem puder, já pode adiantar o trabalho e ir desativando (ou removendo) as regras contraditórias que for encontrando. Para "desativar", é suficiente trocar o asterisco "*" por dois pontos ":". Helder 13h42min de 31 de dezembro de 2010 (UTC)[responder]
Estou a fazer uma revisão (ou deveria dizer, revolução) ao dicionário, em offline. Deixo o aviso à navegação. Espero não demorar muito. Dreispt (discussão) 16h09min de 4 de janeiro de 2011 (UTC) Feito Dreispt (discussão) 17h59min de 4 de janeiro de 2011 (UTC)[responder]


Erros

Nas "Regras independentes dos Acordos Ortográficos" existem os seguintes erros:

  • comummente: comumente //O AO1990 não vai alterar a grafia desta palavra, porque alteraria a pronúncia de "comũmente" para "comúmente"). A regra deveria ser comumente: comummente
  • connosco: conosco // o mesmo que acima para "cõnosco" e "cunosco". A regra deveria ser conosco: connosco.
  • diarréia: diarreia // dependente do AO1990, mudar de secção.
  • européia: europeia // dependente do AO1990, mudar de secção.
  • idéia: ideia // dependente do AO1990, mudar de secção.


É correto. Feito Dreispt (discussão) 14h33min de 2 de fevereiro de 2011 (UTC)[responder]

As letras m e n devem ser dobradas em connosco e comummente.JF (discussão) 16h33min de 2 de fevereiro de 2011 (UTC)[responder]

Sugestões

  • seção: secção //O AO1990 não contempla esta palavra visto que há diferença de pronúncia
  • até o: até ao //O uso de "até o" em pt-pt é muito restrito.
  • até a: até à
  • Em relação a palavras como "ecumênico:ecuménico" haverá de certeza palavras em pt-pt com "ên", "êm", "ôn", "ôm", mas devem ser muito raras. Não se poderia fazer um regra geral do tipo ên:én e depois arranjar algum modo de salvar as excepções como "têm" e "vêm"?
Estive a procurar no portal da língua portuguesas todas as palavras que têm "ên", "êm", "ôn", "ôm" em pt-pt e cheguei à conclusão que palavras de uso comum com "ênV", "êmV", "ônV", "ômV", onde V significa qualquer vogal em pt-pt são só as seguintes:
  • fêmea
sêmola
estômago
Pode ser que dê para fazer uma regra geral qualquer.JF (discussão) 16h32min de 2 de fevereiro de 2011 (UTC)[responder]
Na configuração do script é possível adicionar itens à opção "typo_changes" e ali é possível colocar expressões regulares. Pelo que comentou, as regexes (em amarelo) e as correções dos falsos positivos mencionados ficariam assim:
			'[ê]([mn][aeiouáàâãéêíóôõúü])': 'é$1',
				'fémea': 'fêmea',
				'sémola': 'sêmola',
			'[ô]([mn][aeiouáàâãéêíóôõúü])': 'ó$1',
				'estómago': 'estómago'
A "desvantagem" de usar a "typo_changes" é que ela foi idealizada para correções tipográficas como 'ſ': 's', 'ff': 'ff' e 'ff': 'f' para que os editores pudessem preencher os dicionários usando apenas letras do alfabeto atual. Para isso, as conversões indicadas nessa opção são executadas antes das dos dicionários mantidos pelos editores. Consequentemente, se for adicionado, por exemplo, '[ê]([mn][aeiouáàâãéêíóôõúü])': 'é$1' e houver alguma palavra que além da mudança de "ê" para "é" precise de mais alguma alteração, então será preciso acrescentar ao dicionário uma conversão do tipo "palavra inexistente: palavra correta". Um exemplo disso é a regra "decompo-las: decompô-las" que aparece no dicionário pt-PT do Wikisource. A expressão que aparece efetivamente nos textos é "decompol-as", mas como foi adicionada 'l-a': '-la' é preciso colocar no dicionário "decompo-las" (que não existe nem na ortografia atual nem na antiga).
Ver também: s:Wikisource Discussão:Modernização. Helder 18h03min de 2 de fevereiro de 2011 (UTC)[responder]
Então se é possível, não precisamos de pôr no dicionário toda e qualquer palavra que exista. Basta pôr:
			'[ê]([mn][aeiou])': 'é$1',
				'fémea': 'fêmea',
				'sémola': 'sêmola',
			'[ô]([mn][aeiou])': 'ó$1',
				'estómago': 'estômago'
Nota:Repeti, porque havia um erro no "estômago" e aqueles caracteres acentuados não são necessários.JF (discussão) 18h21min de 2 de fevereiro de 2011 (UTC)[responder]
Ah, sim, falha minha era para ser "estômago" mesmo...
Lembrei de mais uma pequena limitação: no momento o script não é capaz de destacar as mudanças feitas por meio da "typo_changes". O destaque só é possível para as mudanças feitas com base nos dicionários. Helder 19h27min de 2 de fevereiro de 2011 (UTC)[responder]
Fiz o pedido de atualização das configurações do script. Helder 20h56min de 2 de fevereiro de 2011 (UTC)[responder]
Aparentemente não eram só aqueles os falsos positivos. Tem também criptônio: crípton, neônio: néon, nômade: nómada, radônio: rádon e xenônio: xénon. O que é melhor?
  • Desfazer a inclusão das regexes;
  • Adicionar esses novos falsos positivos às configurações; ou
  • Adicioná-los ao dicionário (em suas formas incorretas, como "criptónio: crípton")
Helder 15h03min de 4 de fevereiro de 2011 (UTC)[responder]

Acho que seria melhor adicionar os falsos positivos nas suas formas incorrectas, visto que aparentam ser em menor número.JF (discussão) 13h06min de 6 de fevereiro de 2011 (UTC)[responder]

Depois de ter copiado os falsos positivos para o dicionário, pedi que eles fossem removidos das configurações. Aproveitei para sugerir a adição de dígitos de 0 a 9 e dos indicadores ordinais para que "1º de janeiro: 1 de janeiro" passe a funcionar. Helder 09h41min de 14 de fevereiro de 2011 (UTC)[responder]

Problemas com os títulos

Mas outro problema está a ocorrer. Nos títulos dos artigos, os falsos positivos não estão a ser corrigidos. Veja estômago na versão pt-pt e verifique que embora esteja "estômago" bem grafado em todo o texto, no título permanece "estómago".JF (discussão) 19h51min de 5 de fevereiro de 2011 (UTC)[responder]

Parece que este problema se resolveria com o comando __NOTC__, mas não resulta, ou eu não o sei usar.JF (discussão) 13h06min de 6 de fevereiro de 2011 (UTC)[responder]
O comando que mencionou só existe no conversor do MediaWiki (que não está instalado aqui ainda), mas provavelmente pode ser implementado algo desse gênero no script do Wikisource (como foi feito para criar a {{Não converter}}).
O problema ocorreu porque aquela lista de "typo_changes" aceita tanto regex quanto strings normais (e neste caso o script diferencia maiúsculas e minúsculas), e na hora de pedir a atualização das configurações eu tinha sugerido (por não ter pensado neste detalhe) apenas a string 'estómago': 'estômago'. As opções seriam pedir também a adição de 'Estómago': 'Estômago' ou simplesmente trocar por uma regex /[Ee]stómago/g: '$1stômago'. Mas como apoiou a ideia de "adicionar os falsos positivos nas suas formas incorrectas, visto que aparentam ser em menor número", acho que podemos simplesmente remover das configurações, e adicionar ao dicionário (que para este fim não verá diferença entre minúsculas e maiúsculas) com um comentário contendo uma <ref> que explique a presença da palavra incorreta, como foi feito no Wikisource em casos como este. Helder 14h21min de 6 de fevereiro de 2011 (UTC)[responder]
Tudo o que disse parece correcto. Já confirmei que problema está mesmo relacionado com a letra maiúscula. Quando falei sobre os falsos positivos, não me tinha apercebido de que havia dois modos de o fazer, uma no regex e outra no dicionário. Não sei se as duas estratégias dão o mesmo resultado. Se derem, acho que é mais simples pô-las no dicionário.JF (discussão) 23h52min de 6 de fevereiro de 2011 (UTC)[responder]

Excepções às regras

As excepções às regras são mesmo necessárias. Um exemplo flagrante é o uso da predefinição {{PBPE}} ou algo equivalente. Por exemplo:

"O Irã (português brasileiro) ou Irão (português europeu) (em persa: ايران), oficialmente República Islâmica do Irão..." em que se o conversor estiver "ligado" para pt-pt as duas versões da palavra se tornam "Irão".JF (discussão) 23h53min de 1 de fevereiro de 2011 (UTC)[responder]

O conversor do MediaWiki (que ainda não está disponível) permitiria usar a sintaxe -{texto}- para evitar a conversão, mas o script do Wikisource só ganhou um recurso parecido alguns dias atrás, a pedido de um colaborador do Wikisource espanhol. Só faltava divulgar que a técnica funciona por aqui também .
Para indicar que determinadas partes do artigo não devem ser convertidas (por exemplo, nos casos em que a variação na escrita é o foco do texto - tipicamente nas introduções dos artigos como a que mencionou) basta usar {{Não converter|texto que não deve sofrer conversão}}, como foi feito na PBPE. Helder 12h15min de 2 de fevereiro de 2011 (UTC)[responder]
Perfeito! Assim, parte do problema já está resolvido.JF (discussão) 14h16min de 2 de fevereiro de 2011 (UTC)[responder]

Sugestões foram incorporadas. Questão: o conversor vai funcionar corretamente se as expressões contiverem espaços? por exemplo o caso "até o" -> "até ao". Dreispt (discussão) 14h35min de 2 de fevereiro de 2011 (UTC)[responder]

O conversor do MediaWiki com certeza funcionará. Já este script (que foi inicialmente criado para lidar com a "modernização" da ortografia dos textos antigos do Wikisource) consegue lidar com sequências de no máximo "max_seq" palavras separadas por espaços (salvo um pequeno bug que ainda existe ao lidar com maiúsculas nestes casos, e que um dia deverá ser resolvido...). Na configuração do script o valor de "max_seq" foi definido como sendo igual a 3, mas é possível redefinir esse limite para um número maior (mas tenho a impressão de que números maiores diminuem o desempenho do script). Opcionalmente, qualquer editor pode colocar uma cópia das configurações (e do CSS) em seu vector.js (e vector.css) e aumentar o limite (ou as demais opções) sem afetar o resultado para os demais editores. O Eduardo P esteve utilizando o script desse jeito antes de ser instalado como Gadget.
PS: Fazendo uma cópia pessoal das configurações é possível inclusive definir o seu próprio dicionário em uma subpágina de usuário, com expressões que sejam de sua preferência (e de ninguém mais ). Helder 16h33min de 2 de fevereiro de 2011 (UTC)[responder]

Inconsistências e atualizações

Foi geradaautomaticamente uma lista mostrando o que aconteceria ao usar os dicionários BR e PT um após o outro (ver este tópico se quiser saber para que isso foi feito), e a lista acaba servindo também para identificar a presença de algumas inconsistências entre os dois dicionários (BR e PT).

Se alguém puder, seria interessante conferir quais das regras precisam ser adicionadas/corrigidas aqui e no dicionário BR. Helder 15h13min de 4 de fevereiro de 2011 (UTC)[responder]

Há muito trabalho para fazer e preocuparmo-nos com regras que serão inúteis daqui a meia dúzia de anos é desperdício de tempo. Se puder, faça a lista ignorando palavras que serão erros ortográficos em 2020 (depois do AO-1990 entrar em vigor). Existirão outros robôs para esse fim. Casos reais de inconsistências perdem-se no meio de tantos "acções=>ações=>acções" que só fazem sentido nos próximos três ou quatro anos.JF (discussão) 20h11min de 5 de fevereiro de 2011 (UTC)[responder]
Contudo, reparei no sismo-terremoto-terramoto, que é obviamente um erro. Veja na página Terramoto, onde se esclarece que sismo e terramoto são coisas diferentes.JF (discussão) 20h14min de 5 de fevereiro de 2011 (UTC)[responder]
No meio daquela enorme lista consegui pescar alguma coisa de útil, mas tenho a certeza de que não encontrei tudo:
  • alho-poró: alho-porro
  • Amsterdã: Amesterdão
  • rodovia: autoestrada
  • ônibus: autocarro
  • esôfago: esófago
  • Teerã: Teerão
  • Zimbábue: Zimbabué
  • ácido graxo: ácido gordo

JF (discussão) 00h01min de 7 de fevereiro de 2011 (UTC)[responder]

Experimentei rodar o mesmo script novamente e acho que o diff do que mudou desde a última vez pode indicar algumas regras úteis que estejam faltando em um dos dicionários embora já façam parte do outro. Helder 19h22min de 15 de junho de 2011 (UTC)[responder]

Canterbury

Não estou de acordo com a adição desta palavra: "Canterbury" não é uma palavra da língua portuguesa. DReispt msg 09h29min de 21 de fevereiro de 2011 (UTC)[responder]

É por isso mesmo. Em pt-pt diz-se arcebispo de Cantuária, e não de Canterbury como se diz em pt-br.JF (discussão) 10h43min de 21 de fevereiro de 2011 (UTC)[responder]
Até pode não ser de uso comum; a questão é se a palavra "Canterbury" existe no vocabulário oficial brasileiro? No VOLP da disponibilizado pela Infopédia não consta. Não sou a favor da inclusão de palavras (salvo jargão) que não existam num VOLP. DReispt msg 11h49min de 21 de fevereiro de 2011 (UTC)[responder]
É uma ironia do destino, mas a prova de que não podemos simplesmente fazer essa alteração surgiu da pior maneira.JF (discussão) 10h46min de 22 de fevereiro de 2011 (UTC)[responder]

fato: facto

Em vez desta edição, não seria suficiente colocar as regras "nulas"

  • fato de banho: fato de banho
  • fato-macaco: fato-macaco

para poder manter a regra original? Ou há muitos outros falsos positivos? Helder 00h04min de 4 de abril de 2011 (UTC)[responder]

Eu pensei no mesmo, mas desisti. Mas agora pensando bem é melhor fazer isso.

O exemplos dados são os mais fáceis porque são expressões, mas há o simples "fato", como aquele que levamos aos casamentos e entrevistas de emprego e esse deve ser difícil de distinguir automaticamente. De qualquer modo, este falso positivo deve ser em pequeno número.

A propósito, há desenvolvimentos sobre o uso de -{}- e uso de tabelas de conversão não globais?JF (discussão) 00h46min de 4 de abril de 2011 (UTC)[responder]

Perguntei novamente no bugzilla:26121 se há algo que possamos fazer para acelerar a instalação do conversor em alguma wiki de testes. Vamos ver se respondem.
Embora a sintaxe -{}- seja só do conversor do próprio MediaWiki, o script do Wikisource também permite que sejam feitos dicionários locais em artigos. É só copiar a s:Predefinição:Modernização automática, provavelmente para um nome melhor, e mudar o id para "conv-idiomas". Eu ia sugerir {{Converter}}, já que existe a {{Não converter}}, mas infelizmente já está em uso. Então que tal {{Conversão}}?
Uma vez criada, podem também ser feitas predefinições para guardar dicionários locais comuns a artigos de determinado grupo, de modo que não seja preciso colocar as mesmas regras em vários artigos. Por exemplo, se "mouse: rato" e "arquivo: ficheiro" costumam ser conversões válidas em um mesmo grupo de artigos (geralmente de informática), tais conversões poderiam ser colocada em uma só predefinição que serviria para guardar o dicionário local usado pelo grupo dos artigos em que elas sejam válidas. (tudo bem que "arquivo: ficheiro" parece ser válido sempre, mas serve para dar um exemplo do que os chineses fazem para lidar com essas variações regionais que nem sempre podem ir para as tabelas globais). Helder 02h08min de 4 de abril de 2011 (UTC)[responder]
Criei a Predefinição:Conversão a partir da wikisource:Predefinição:Modernização automática. Agora é possível definir dicionários locais para certos artigos, como neste exemplo. Helder 16h30min de 29 de junho de 2011 (UTC)[responder]