Wikipédia:Filtro de edições/Análise: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
→‎Filtro 42: Mais uma edição marcada indevidamente: https://secure.wikimedia.org/wikipedia/pt/w/index.php?title=WikiLeaks&diff=prev&oldid=26915700
Linha 170: Linha 170:
:::Sobre o filtro 42, até o corrigi, mas depois o desativei, já que não vi custo-benefício suficiente (aos pouquinhos estou desativando os filtros de pouca eficácia, para ver se diminuo a questão dos limites de ocorrências e de condições). Sobre o filtro 44, tenho minhas ressalvas. Penso que esse tipo de código não deveria ser utilizado diretamente nos artigos, mas através de predefinições que sejam auto-explicativas para um novato que se aventure a editar o trecho. "Códigos complicados" no artigo podem até assustar um editor que queira mudar algo mas tenha medo de "fazer besteira". Resumindo: não tenho certeza que foi um falso positivo, heheheheh... [[Usuário:Kleiner|Kleiner]] <sup>[[Usuário Discussão:Kleiner|msg]]</sup> 15h09min de 8 de setembro de 2011 (UTC)
:::Sobre o filtro 42, até o corrigi, mas depois o desativei, já que não vi custo-benefício suficiente (aos pouquinhos estou desativando os filtros de pouca eficácia, para ver se diminuo a questão dos limites de ocorrências e de condições). Sobre o filtro 44, tenho minhas ressalvas. Penso que esse tipo de código não deveria ser utilizado diretamente nos artigos, mas através de predefinições que sejam auto-explicativas para um novato que se aventure a editar o trecho. "Códigos complicados" no artigo podem até assustar um editor que queira mudar algo mas tenha medo de "fazer besteira". Resumindo: não tenho certeza que foi um falso positivo, heheheheh... [[Usuário:Kleiner|Kleiner]] <sup>[[Usuário Discussão:Kleiner|msg]]</sup> 15h09min de 8 de setembro de 2011 (UTC)
:::Sobre as etiquetas, é uma excelente idéia. Não sei nem porque não pensei isso antes, hahhahahahahah... [[Usuário:Kleiner|Kleiner]] <sup>[[Usuário Discussão:Kleiner|msg]]</sup> 15h11min de 8 de setembro de 2011 (UTC)
:::Sobre as etiquetas, é uma excelente idéia. Não sei nem porque não pensei isso antes, hahhahahahahah... [[Usuário:Kleiner|Kleiner]] <sup>[[Usuário Discussão:Kleiner|msg]]</sup> 15h11min de 8 de setembro de 2011 (UTC)
[https://secure.wikimedia.org/wikipedia/pt/w/index.php?title=WikiLeaks&diff=prev&oldid=26915700 Mais uma] edição marcada indevidamente. [[b:pt:User:Helder.wiki|Helder]] 21h50min de 14 de setembro de 2011 (UTC)

Revisão das 21h50min de 14 de setembro de 2011

Página principal (discussão) Instruções Análise e estatísticas Bloqueios Etiquetas Arquivo Gestão: Filtro   Etiquetas

Filtro 3

O filtro 3 está a ter problemas na página Especial:Entrar por alguma razão. GoEThe (discussão) 10h27min de 17 de abril de 2009 (UTC)[responder]

Já corrigi isso, Lechatjaune msg 17h13min de 17 de abril de 2009 (UTC)[responder]

Filtro 10

Qual é a lógica daquela condição? Ele detecta 6 caracteres em sequência? Acho que está detectando falso positivo…

Outra dúvida: porque esse IP não tem registro de contribuições? 21h25min de 20 de abril de 2009: 189.24.190.246 (discussão) despoletou um filtro de abuso, executando a ação "edit" em Magica. Ações tomadas: nenhum; Descrição do filtro: caracteres repetidos o comentário precedente não foi assinado por Kleiner (discussão • contrib.) 18h31min de 20 de abril de 2009

Também não entendi. Encontrou muitos falsos positivos e poucas entradas válidas. As contribuições são um mistério: nem as eliminadas aparecem. Mas o filtro detectou vandalismo corretamente, vide log. Daimore msg 20h29min de 21 de abril de 2009 (UTC)[responder]
Deu falso positivo nesta edição! Como não estou familizarizado com regex, ainda não peguei o significado do '(..)/1{6}' Se entendi bem, ele pega um conjunto de dois carcteres iguais que se repitam por pelo menos seis vezes no texto, é isso?
Outra dúvida: ele analisa apenas a alteração do editor ou procura o problema no artigo inteiro? Por exemplo, se o artigo já tinha um "aaaaaaaa" escrito em algum canto, e de repente um IP corrige outra coisa que nada tem a ver, issi vai fazer com que ele caia no filtro? Kleiner msg 22h23min de 21 de abril de 2009 (UTC)[responder]
Eureka! Fazendo uns testes aqui, descobri o problema: o ponto final inclui qualquer caractere, inclusive espaços em branco (isto quer dizer que os espaços das infoboxes, que damos por questão de legibilidade do código, caem no filtro…), e é isso que está causando tantos falsos positivos nesse filtro específico! Solução sugerida: aplicar o filtro apenas para caracteres alfabéticos (se deixarmos númericos, artigos de matemática caírão constantemente no filtro… hehehehe)
Mas a outra dúvida persiste (o filtro analisa apenas a linha modificada ou o código do artigo inteiro?) Kleiner msg 20h10min de 22 de abril de 2009 (UTC)[responder]
Depende da variável utilizada: added_lines ou new_wiki_text. Lechatjaune msg 02h06min de 23 de abril de 2009 (UTC)[responder]

Usuários IP's reclamando

Recebi uns três e-mails, provavelmente da Wikipedia:Contato, reclamando que suas edições estão sendo acusadas de conteúdo ofensivo e creio que seja alguma configuração do filtro. São usuários IP's, pois dizem que além das letras (o captha), eles tem de salvar seguidas vezes sem sucesso. Eles conseguem salvar, mas depois de umas quatro ou cinco tentativas.

Sugiro que se crie algum alerta para avisar do filtro em testes, na página de edições, alertando que estamos buscando controlar o vandalismo e estamos testando uma ferramenta e que a edição dele pode ter sido um falso positivo. ∴Dédi's (discussão) 03h52min de 25 de abril de 2009 (UTC)[responder]
André, algum deles citou um artigo nos e-mails, sabe de algum diff que possamos analisar para evitar esses (prováveis) falsos positivos? Daimore msg 03h55min de 25 de abril de 2009 (UTC)[responder]
E essas reclamações foram recebidos hoje, ou dias antes? Me parece que o filtro 7 despoletou em edições impecáveis hoje como nunca havia feito antes (exemplo1 e 2) devido às mudanças feitas no dia 24. Há algum erro nas condições previstas pelo filtro causando isso. Daimore msg 04h00min de 25 de abril de 2009 (UTC)[responder]
Ok, desativei o aviso por enquanto. Daimore msg 05h26min de 25 de abril de 2009 (UTC)[responder]
Opa, tinha um erro, que inseri ontem. Suponho que esteja melhor agora. Não reativei o aviso.
Os falsos positivos pararam. Lechatjaune msg 14h23min de 25 de abril de 2009 (UTC)[responder]

Filtro 12 - Apagar página de usuário

13h43min de 30 de abril de 2009: Daimore (discussão | contribs) despoletou um filtro de abuso, executando a ação "delete" em Usuário:Editora ovação?. Ações tomadas: nenhum; Descrição do filtro: Edição em página de usuário alheia
13h38min de 30 de abril de 2009: Davemustaine (discussão | contribs) despoletou um filtro de abuso, executando a ação "delete" em Usuário:Blingee?. Ações tomadas: nenhum; Descrição do filtro: Edição em página de usuário alheia


Creio que as ações "delete" não deveriam ser incluídas no filtro. Como só adms podem faze-la, não deve ser vandalismo (espero). ⇒ Rjclaudio msg 18h12min de 30 de abril de 2009 (UTC)[responder]

Sim, sim, veja que o filtro que está em modo teste. Nenhuma ação é tomada. Na verdade, eu ainda não achei um jeito de separar edições corretas de edições abusivas ali. Lechatjaune msg 18h13min de 30 de abril de 2009 (UTC)[responder]
Esse erro também ocorreu comigo. Tem como ser corrigido? (Pergunta sem tom de crítica, é que eu não entendo nada dessas coisas) Se sim, quando for corrigido esse registro desaparece? Filipe Ribeiro Msg 17h25min de 22 de junho de 2009 (UTC)[responder]
Alterei o filtro, ele só vai disparar se ação for feito por usuário não-autoconfirmado (contas novas e anônimos). Mas suponho que vocês não tenham recebido qualquer mensagem de aviso, pelo que o filtro está em modo teste. Lechatjaune msg 17h35min de 22 de junho de 2009 (UTC)[responder]

Análise de logs

Durante esta semana estive observando os logs dos filtro referentes às páginas novas, o 2 e o 6. Os resultados podem ser vistos em Usuário:Daimore/Análise de logs.

Com isso pude ver que ambos os filtros estão impecáveis, e os problemas que tinham já foram consertados. Gostaria de saber o que pensam dessa iniciativa. É uma forma de centralizar a verificação de falsos positivos e da utilidade do filtro e de deixar claro que há alguém fazendo essas verificações periodicamente. Não sei até que ponto isso é útil e pode ser feito por mais pessoas. Talvez seja o caso de analisar apenas os logs a partir da última edição em um filtro, a fim de diminuir o trabalho de verificação.

Também aproveito pra perguntar se é possível - ou viável - já implementar a opção de "Impedir o utilizador de realizar a ação em questão", contanto que haja alguém observando os logs periodicamente. Nesses casos teríamos evitado o ímpeto de algumas contas de ataque e a criação de muitas páginas impróprias. Boa parte dos vandalismos óbvios em artigos novos vem sendo detectado por esse filtro, e eu estou sempre procurando novas maneiras de detectar artigos novos fora do escopo do projeto. Daimore msg 18h51min de 30 de abril de 2009 (UTC)[responder]

Aproveitando: sei que o Lechatjaune está procurando maneiras de incluir vários filtros em um só; seria interessante ter o filtro 7 adicionado ao filtro 6. Páginas novas com conteúdo ofensivo são claramente impróprias. Daimore msg 18h57min de 30 de abril de 2009 (UTC)[responder]
Apesar do atraso, eu fiz isso. Não fiz antes porque estava testando o filtro 7. Lechatjaune msg 15h15min de 23 de junho de 2009 (UTC)[responder]

Imagino que este nosso filtro corresponde mais ou menos ao en:Special:AbuseFilter/9 da Wikipédia inglesa. E lá, em vez de se usar um único espaço para separar as palavras, é usado o \s+ (que detecta um ou mais espaços), ou \s* (que identifica zero ou mais espaços consecutivos) e o [ -]* (que detecta um ou mais espaços/hífens consecutivos). Acho que isto podia ser usado no filtro 7 daqui. Helder15h53min de 3 de setembro de 2009 (UTC)[responder]

Notei que no en:Special:AbuseFilter/11 é usada uma sintaxe que permite "definir uma variável" dentro do filtro, evitando que seja necessário repetir uma grande parte do código. Usa-se o "nome:=valor" para fazer a definição, e depois o "nome" pode ser usado em outros locais do mesmo filtro. Acho que pode ser aplicado ao filtro 7 daqui. Helder01h00min de 9 de março de 2010 (UTC)[responder]

Filtro 28

Não consigo de jeito nenhum editar o filtro 28. Quando eu o abro e peço para verificar a sintaxe, o filtro já indica um erro. Não sei o que pode ser. Lechatjaune msg 21h11min de 11 de janeiro de 2010 (UTC)[responder]

Falso positivo. Não sei o que se passou. GoEThe (discussão) 12h50min de 20 de janeiro de 2010 (UTC)[responder]

Veja seção 18-ER. Tem um <nowiki>{{Lixo}}</nowiki>. Mudei o código pra só detectar se tiver algum parametro (troquei [\|\}] por \| no final. Assim não detecta mais {{Lixo}}, mas detecta {{Lixo|~~~~}}. Mas imagino q ainda terá alguns falso-positivos qnd alguém arquivar discussões q tem alguma tag de eliminação dentro de nowiki. Rjclaudio msg 13h24min de 20 de janeiro de 2010 (UTC)[responder]
Não dá para dizer para não detectar quando estiver dentro do nowiki? GoEThe (discussão) 14h01min de 20 de janeiro de 2010 (UTC)[responder]

Colocaria um <nowiki>[^<>]*{{lixo\|. Reconhece quebra de linha, e caso tenha um /nowiki antes da predef ele reconhece. Se tiver algum < ou > entre o nowiki e a predef ele não vai reconhecer. Desse jeito deve pegar todos os usos corretos. As exceções me parecem mt poucas e seriam mais para vandalismo, se bem q nunca vi vandalismo com tag de eliminarr dentro de nowiki. Vou colocar esse código por enquanto. Rjclaudio msg 14h25min de 20 de janeiro de 2010 (UTC)[responder]

  • Meu problema é o tempo, estava com 3,8ms e agora com mais esse código deve aumentar mais. Talvez dê pra tirar a exceção pros dois bots já q esse novo código não daria falso-positivo nos arquivamentos bem-feitos.
  • Esse tempo, na prática, representa o q? O qnt de tempo o software demora para analisar a edição, ok, então esse é o tempo que demora pro software gravar a edição? Tem algum limite para o tempo, ou só tem limite pro número de condições?
  • Rjclaudio msg 14h30min de 20 de janeiro de 2010 (UTC)[responder]

Filtro 37

A edição que resultou neste falso positivo foi, incrivelmente, minha! Por acaso entrei na Wikipédia. Ao ver a etiqueta "repetição de caracteres" nas MRs, verifiquei o vandalismo e tentei reverter usando o botão "desfazer", como IP mesmo (estava com preguiça de logar), quando fui bloqueado pelo filtro.

Verifiquei que o filtro está bloqueando duas faixas de 65.534 potenciais usuários, cada uma. Não havia notado este filtro até ser pego por ele, e penso que esse bloqueio tão abrangente a IPs não é nada eficiente. Por isso o desativei temporariamente, até que ele seja melhorado e possamos discutir profundamente o uso do filtro de edições para bloqueio de faixas de IPs, já que hoje não há nada documentado em específico. Kleiner msg 19h02min de 13 de fevereiro de 2010 (UTC)[responder]

Filtro 59

Falso positivo "Código wiki errado" do filtro 59 (Redirect em local errado) com um comentário:

'''Virtanen''' (ou '''Wirtanen<!--#REDIRECT-->''') é um sobrenome ...

(Corrigido no Virtanen pela remoção # [1]) -- 62.147.24.102 (discussão) 21h11min de 13 de março de 2010 (UTC)[responder]

Continua errado do mesmo jeito. Não tem pq colocar isso no código. Não é necessário indicar que o outro nome redireciona para essa desambig. Editei a página retirando isso. Rjclaudio msg 21h25min de 13 de março de 2010 (UTC)[responder]

Filtro 72

Agora há pouco, fuçando por curiosidade meus registros no filtro, deparei-me com uma enxurrada de registros do filtro 72 ("Remoção de ficheiro"). A imensa maioria foi causada pela aplicação de uma predefinição para reduzir o código da página (como aqui). Não fui impedido de editar nem recebi qualquer aviso, mas acredito que algo pode ser feito para aperfeiçoar este filtro, uma vez que usuários experientes e novatos bem-intencionados não saem por aí removendo ficheiros à toa. Filipe Ribeiro Msg 21h33min de 29 de março de 2010 (UTC)[responder]

Um início seria não ter predef nas linhas adicionadas. Nem sei mais se o filtro é tão necessário agora, já que pros casos que ele seria útil (vandalismo) já tem outros filtros que deveriam pegar. Rjclaudio msg 00h00min de 30 de março de 2010 (UTC)[responder]

Filtro 26

Um bug no filtro 26 (bloqueio por abuso de espaço público) deixou recentemente as mudanças recentes sem nenhuma edição feita por IPs. E o pior: o registro de novos usuários não registrou nenhuma conta recém-criada, a menos que seja criada automaticamente, pois foi criada em uma outra wiki. O que há de errado? --Francisco diz!-fiz 01h42min de 9 de julho de 2010 (UTC)[responder]

Erro de sintexe introduzido por acidente no atendimento deste pedido. Corrigido aqui e aqui. Ruy Pugliesi 02h00min de 9 de julho de 2010 (UTC)[responder]

Falso positivo?

Alguém sabe explciar porque esta edição foi detectada por este filtro? Kleiner msg 18h56min de 3 de agosto de 2010 (UTC)[responder]

Filtro 79: PN em domínio impróprio

Como a página Especial:Carregar imagem foi reaberta para upload de imagens restritas, creio que este filtro não tem mais sentido. Alguém poderia desativá-lo temporariamente, por favor? --Francisco disc contrib 13h43min de 1 de setembro de 2010 (UTC)[responder]

Feito. – Opraco (discussão) 18h57min de 31 de janeiro de 2011 (UTC)[responder]

Filtro 22: remoção de ER

Alguém poderia trocar a linha !("autoconfirmed" in user_groups) por (user_editcount < 50)? Houve recentemente uma remoção de ER em Especialista focal por um usuário autoconfirmado chamado Enofilho D​ C​ E​ F registrado em 2006.

Com esta alteração, apenas usuários registrados com mais de 50 edições poderão remover as tags de ER sem serem avisados, e somente se as páginas estiverem em desacordo com uma das regras de eliminação rápida. Francisco disc contrib 11h43min de 25 de outubro de 2010 (UTC)[responder]

Feito! Substitui uma condição pela outra, conforme solicitado... Kleiner msg 22h46min de 19 de janeiro de 2011 (UTC)[responder]

Alguém poderia trocar o trecho usuário:salebot/lixo por usuário:salebot/impróprio? A predefinição {{Usuário:Salebot/Lixo}} foi movida para {{Usuário:Salebot/Impróprio}}. Francisco discussão 00h00min de 22 de dezembro de 2010 (UTC)[responder]

Feito! Kleiner msg 18h04min de 22 de dezembro de 2010 (UTC)[responder]

Simplificação do código do filtro 10

A regex

([a-záâãéêíóôõúç][^\-]|[a-záâãéêíóôõúç][^\-][^\-]|[a-záâãéêíóôõúç][^\-][^\-][^\-])\1{3}

usada 3 vezes no filtro 10 (e que detecta três usos consecutivos [e idênticos] de uma string do tipo "uma letra minúscula seguida de 1, 2 ou 3 caracteres que não sejam um hífen") pode ser trocada pela seguinte:

([a-záâãéêíóôõúç][^\-]{1,3})\1{3}

Helder 01h49min de 11 de março de 2011 (UTC)[responder]

Muito obrigado pela sugestão, já foi implementada. Kleiner msg 17h31min de 11 de março de 2011 (UTC)[responder]
Mais uma coisa: se preferir, também dá para agrupar as três ocorrências do regex declarando uma variável "repetido":
!("autoconfirmed" in user_groups) &
(article_namespace == 0 | article_namespace == 102) & (
repetido:="([a-záâãéêíóôõúç][^\-]{1,3})\1{3}";
lcase(added_lines) rlike repetido &
!(lcase(removed_lines) rlike repetido) &
!lcase(added_lines) rlike ".*http:.*" + repetido)
Isso é algo que pode ser útil em outros filtros também. Helder 18h10min de 11 de março de 2011 (UTC)[responder]
Inicialmente achava que o filtro interessaria também pessoas sem conhecimento prévio de lógica de programação, e que por isso usar variáveis sem comentários ao lado delas tornaria o código menos intuitivo... Mas, depois de um ano observando o desinteresse geral (muito por culpa de nossa própria falha em documentar apropriadamente a ferramenta), hoje concordo que podemos usar variáveis sem maiores preocupações... Kleiner msg 11h20min de 14 de março de 2011 (UTC)[responder]

CU

A expressão "Cu" tem causado alguns falsos positivos, em especial em fórmulas químicas envolvendo cobre. Entretanto essa palavra é um dos vandalismos mais comuns.

Por isso estou retirando a detecção de vandalismos com esse termo dos filtros 7 e 18 (filtros anti-ofensas comuns) e colocando num filtro específico. Isso permitirá fazer uma análise mais detalhada para aprimorar o novo filtro. Até que mais observações sejam feitas, julgo apropriado deixá-lo apenas no modo de aviso, por isso é provável que haja um leve aumento no número de vandalismos do tipo. Kleiner msg 18h20min de 6 de junho de 2011 (UTC)[responder]

É o filtro 70. Kleiner msg 21h55min de 6 de junho de 2011 (UTC)[responder]

Esta edição foi etiquetada indevidamente com o texto "Código wiki errado".

Além disso, parece que está sobrando um " &" no final da lista de condições do filtro, embora essa não deva ser a causa deste falso positivo. Helder 11h59min de 30 de agosto de 2011 (UTC)[responder]

O filtro que sua edição disparou foi o 44. O 42 não casa com nenhuma edição desde janeiro de 2010.
Confesso que não entendi o objetivo do código no artigo, nem entendo exatamente que tipo de edição imprópria o Rjclaudio pretendia detectar quando criou o filtro. Por isso não sei o que deveria ser consertado ou não. Se o Rjclaudio puder analisar isso, será ótimo. Caso contrário, receio fazer qualquer outra coisa que não seja desativar o etiquetamento de edições (se preferir isto, é só avisar). Kleiner msg 15h23min de 1 de setembro de 2011 (UTC)[responder]
O objetivo foi mencionado no link indicado no sumário. Por acaso não seria boa ideia descrever as etiquetas atuais indicando por exemplo qual(is) filtro(s) usa tais etiquetas, como na coluna "description" da en:Special:Tags? Isso facilitaria a busca de um filtro problemático no futuro (evitando enganos como o anterior).
De qualquer modo, acho que o " &" está sobrando no filtro 42. Helder 19h06min de 6 de setembro de 2011 (UTC)[responder]
Sobre o filtro 42, até o corrigi, mas depois o desativei, já que não vi custo-benefício suficiente (aos pouquinhos estou desativando os filtros de pouca eficácia, para ver se diminuo a questão dos limites de ocorrências e de condições). Sobre o filtro 44, tenho minhas ressalvas. Penso que esse tipo de código não deveria ser utilizado diretamente nos artigos, mas através de predefinições que sejam auto-explicativas para um novato que se aventure a editar o trecho. "Códigos complicados" no artigo podem até assustar um editor que queira mudar algo mas tenha medo de "fazer besteira". Resumindo: não tenho certeza que foi um falso positivo, heheheheh... Kleiner msg 15h09min de 8 de setembro de 2011 (UTC)[responder]
Sobre as etiquetas, é uma excelente idéia. Não sei nem porque não pensei isso antes, hahhahahahahah... Kleiner msg 15h11min de 8 de setembro de 2011 (UTC)[responder]

Mais uma edição marcada indevidamente. Helder 21h50min de 14 de setembro de 2011 (UTC)[responder]