Ultimamente, parece que o Google não só melhorou o desempenho dos modelos fundacionais, como também está fazendo um ótimo trabalho na forma de integrá-los a esse tipo de serviço.
Concordo que, seja pelo User-Agent que você mencionou ou pela detecção baseada em IP citada no post original, é difícil afirmar se algo é malicioso, já que informações de identificação podem ser falsificadas. Bots realmente maliciosos provavelmente abordariam isso de forma mais sofisticada.
Na minha opinião, em vez desse tipo de ataque, talvez uma "cutucada" mais realista fosse oferecer uma API de crawling com limitação de carga, permitindo acessos automatizados legítimos enquanto protege os recursos do servidor. rsrs
Sinceramente... isso é insano... mesmo que vire um serviço pago, a qualidade é de algo pelo qual eu pagaria.
Ao ouvir em formato de podcast sobre temas que me interessam, acabo absorvendo as informações com ainda mais atenção.
Muito bom mesmo
Claro, como não é um espaço público, talvez seja só um texto postado sem pensar muito.
Assim como alguém pode deixar um comentário na comunidade sem pensar muito.
Como eu não consigo bloquear completamente os crawlers, o ideal seria não receber nem as tentativas, então fiquei curioso sobre a intenção de chamar atenção.
Qual será o objetivo de publicar um texto desses?
Na prática, acho muito improvável que empresas que realmente operam crawlers leiam isso e cheguem ao ponto de excluir o site por causa disso.
Então, para que tipo de leitor esse texto foi escrito?
Seria um texto de apresentação para mostrar a outras pessoas que também mantêm blogs que esse tipo de método existe,
ou uma provocação do tipo “meu blog é tão seguro assim, então tente rastreá-lo se puder”?
Fico realmente curioso para saber o que se ganha ao publicar um texto assim.
TAC (Traffic Acquisition Cost) é o custo pago a fabricantes de dispositivos ou empresas de navegadores para definir o Google como mecanismo de busca padrão. Dá para pensar nisso como uma certa porcentagem da receita por consulta de busca.
Como esse TAC foi visto como parte do domínio do Google no mercado de buscas, o Departamento de Justiça entrou com uma ação antitruste e, recentemente, saiu a decisão de que se trata de monopólio, então agora está surgindo a conversa sobre a venda do Chrome.
A ideia é presentear com uma bomba quem vier com um pedido dizendo que é um bot..
É maligno demais. De qualquer forma, é fácil para um agent se esconder. Se for um bot realmente malicioso, ele não vai expor sua malícia.
Eu também vinha fazendo de forma parecida, mas agora estou escrevendo diretamente no repositório do github.com. (usando o recurso em que o GitHub Pages faz o build do Jekyll automaticamente)
Não é um jeito eticamente bom. E também não é uma solução fundamental.
Que texto divertido! É um método em que eu nunca tinha pensado, então obrigado por compartilhar!
Oh~ estou ansioso por isso.
Ultimamente, parece que o Google não só melhorou o desempenho dos modelos fundacionais, como também está fazendo um ótimo trabalho na forma de integrá-los a esse tipo de serviço.
Uau, isso é sensacional;;
https://freederia.com/researcharchive/
É o site do cientista de IA.
Esse tipo de direção vai incentivar ainda mais a diversidade de caminhos.
A frase
quando recompensas interferem na autonomia do indivíduo, elas prejudicam a motivação intrínsecarealmente faz sentido para mim.Concordo que, seja pelo
User-Agentque você mencionou ou pela detecção baseada em IP citada no post original, é difícil afirmar se algo é malicioso, já que informações de identificação podem ser falsificadas. Bots realmente maliciosos provavelmente abordariam isso de forma mais sofisticada.Na minha opinião, em vez desse tipo de ataque, talvez uma "cutucada" mais realista fosse oferecer uma API de crawling com limitação de carga, permitindo acessos automatizados legítimos enquanto protege os recursos do servidor. rsrs
Sinceramente... isso é insano... mesmo que vire um serviço pago, a qualidade é de algo pelo qual eu pagaria.
Ao ouvir em formato de podcast sobre temas que me interessam, acabo absorvendo as informações com ainda mais atenção.
Muito bom mesmo
Eu testei e é realmente incrível....
Se fosse para pagar para usar, acho que usaria só esse de forma contínua. Serviços parecidos devem sentir bastante o impacto.
Claro, como não é um espaço público, talvez seja só um texto postado sem pensar muito.
Assim como alguém pode deixar um comentário na comunidade sem pensar muito.
Como eu não consigo bloquear completamente os crawlers, o ideal seria não receber nem as tentativas, então fiquei curioso sobre a intenção de chamar atenção.
Uau, isso é impressionante.
É um blog pessoal; não posso escrever qualquer coisa? 🤔
Como vocês lidam com mudanças de versão?
Qual será o objetivo de publicar um texto desses?
Na prática, acho muito improvável que empresas que realmente operam crawlers leiam isso e cheguem ao ponto de excluir o site por causa disso.
Então, para que tipo de leitor esse texto foi escrito?
Seria um texto de apresentação para mostrar a outras pessoas que também mantêm blogs que esse tipo de método existe,
ou uma provocação do tipo “meu blog é tão seguro assim, então tente rastreá-lo se puder”?
Fico realmente curioso para saber o que se ganha ao publicar um texto assim.
Então, se ele julgar que é um bot pelo IP, quer dizer que também vai mandar a bomba, né? haha
Dá para sentir a raiva do autor. haha
Grupos de abas serão muito usados? Claro, eu também uso, mas...
TAC (Traffic Acquisition Cost) é o custo pago a fabricantes de dispositivos ou empresas de navegadores para definir o Google como mecanismo de busca padrão. Dá para pensar nisso como uma certa porcentagem da receita por consulta de busca.
Como esse TAC foi visto como parte do domínio do Google no mercado de buscas, o Departamento de Justiça entrou com uma ação antitruste e, recentemente, saiu a decisão de que se trata de monopólio, então agora está surgindo a conversa sobre a venda do Chrome.
A ideia é presentear com uma bomba quem vier com um pedido dizendo que é um bot..
É maligno demais. De qualquer forma, é fácil para um agent se esconder. Se for um bot realmente malicioso, ele não vai expor sua malícia.
Eu também vinha fazendo de forma parecida, mas agora estou escrevendo diretamente no repositório do github.com. (usando o recurso em que o GitHub Pages faz o build do Jekyll automaticamente)
https://plan9.kr/