Oásis de Alegria > #4

Os três deles leram um artigo econômico.
Huang Jianhua
Patrick, deixe-me explicar as partes importantes deste artigo para você.
Patrick O'Leary
Claro, Huang. Por favor, explique em termos que eu possa entender.
Huang Jianhua
Este artigo é sobre um conjunto de dados em grande escala de jornais históricos dos EUA chamado American Stories.
Patrick O'Leary
O que significa 'conjunto de dados em grande escala'?
Huang Jianhua
Significa que há uma enorme quantidade de dados neste conjunto de dados. Ele contém quase 20 milhões de digitalizações de jornais.
Patrick O'Leary
Uau, isso é muito!
Huang Jianhua
Sim, é. Os pesquisadores usaram um pipeline de aprendizado profundo para extrair os textos completos dos artigos das imagens dos jornais.
Patrick O'Leary
Aprendizado profundo? O que é isso?
Huang Jianhua
Aprendizado profundo é um tipo de inteligência artificial que aprende com dados para fazer previsões ou realizar tarefas.
Patrick O'Leary
Entendi.
Putri
Ei pessoal, tenho uma ideia! Podemos usar indevidamente esse conjunto de dados para ganhar dinheiro.
Huang Jianhua
Uso indevido? Isso não parece uma boa ideia.
Putri
Mas pense nisso. Podemos usar esse conjunto de dados para criar um jornal sensacionalista que atrairá muita atenção e anunciantes. Podemos até conseguir um grande investimento de uma empresa de Organizações Religiosas Cult.
Huang Jianhua
Putri, há preocupações éticas com o que você está sugerindo. É importante usar os dados de forma responsável e não manipulá-los para ganho pessoal.
Putri
Mas eu quero ser bem-sucedida e ganhar muito dinheiro!
Huang Jianhua
Sucesso e dinheiro não são as únicas coisas que importam na vida, Putri. Existem outros valores e significados além da riqueza financeira.
Patrick O'Leary
Huang está certo, Putri. Devemos sempre considerar as implicações éticas de nossas ações.
Weeks Pass
(Semanas passam e a cena muda)
Putri
Huang, estou em crise! Meu negócio de jornal está enfrentando processos judiciais, acidentes e suspensões de contratos.
Huang Jianhua
Eu te avisei sobre os riscos, Putri. Você não ouviu.
Patrick O'Leary
Huang, precisamos fazer algo para ajudar a Putri.
Huang Jianhua
Eu sei, Patrick. Vou relutantemente tentar resolver a crise.
Huang Jianhua
Mas lembre-se, Putri, o sucesso não deve vir à custa da moralidade e da ética.
Patrick O'Leary
Huang, por que você acha que este artigo é significativo?
Huang Jianhua
Este artigo é importante porque fornece um conjunto de dados de alta qualidade que pode ser usado para melhor entender o inglês histórico e o conhecimento histórico mundial. Ele também pode ser usado para várias aplicações de ciências sociais, como classificação de tópicos e detecção de conteúdo reproduzido.
Huang Jianhua
Mas, mais importante, ele serve como um lembrete de que o sucesso não se trata apenas de dinheiro. Trata-se de usar conhecimento e recursos de forma responsável e considerar o bem-estar dos outros.
A conversa termina com as palavras de Huang, deixando todos com uma lição valiosa.

Title: American Stories: A Large-Scale Structured Text Dataset of Historical U.S. Newspapers
Authors: Melissa Dell, Jacob Carlson, Tom Bryan, Emily Silcock, Abhishek Arora, Zejiang Shen, Luca D'Amico-Wong, Quan Le, Pablo Querubin, Leander Heldring
View this paper on arXiv