fix bar
fix bar
fix bar
fix bar
fix bar
fix bar
Inglês Mundial Clube
Massive-scale online collaboration Luis von Ahn
Lento Devagar Normal
Rápido
Acelerado
Frenético
 
 


. . .



 


. . .



Quer escutar primeiro e depois ver a legenda?
Ativar Tocar e Pausar (Beta)

Transcrição e tradução:

00:00...
...

[1] 00:15How many of you had to fill out some sort of web form
Quantos de vocês já preencheu algum tipo de formulário da web

[2] 00:17where you've been asked to read a distorted sequence of characters like this?
em que tiveram que ler uma distorcida sequência de caracteres como esta?

[3] 00:19How many of you found it really, really annoying?
Quantos de vocês achou isso realmente chato?

[4] 00:21Okay, outstanding. So I invented that.
Ok, excelente. Então, eu inventei isso.

[5] 00:24(Laughter)
(Risadas)

[6] 00:26Or I was one of the people who did it.
Ou fui uma das pessoas que inventou.

[7] 00:28That thing is called a CAPTCHA.
Aquela coisa é chamada CAPTCHA.

[8] 00:30And the reason it is there is to make sure you, the entity filling out the form,
E a razão pela qual isso existe é para garantir que você, a entidade que preenche o formulário,

[9] 00:32are actually a human and not some sort of computer program
é realmente um humano e não apenas um programa de computador

[10] 00:35that was written to submit the form millions and millions of times.
que foi criado para preencher formulários milhões e milhões de vezes.

[11] 00:37The reason it works is because humans,
A razão pela qual funciona é porque humanos,

[12] 00:39at least non-visually-impaired humans,
pelo menos os que não possuem deficiências visuais,

[13] 00:41have no trouble reading these distorted squiggly characters,
não possuem problema lendo esses caracteres distorcidos,

[14] 00:43whereas computer programs simply can't do it as well yet.
enquanto programas de computadores simplesmente não fazem isso ainda.

[15] 00:46So for example, in the case of Ticketmaster,
Por exemplo, no caso do Ticketmaster,

[16] 00:48the reason you have to type these distorted characters
a razão pelo qual você tem que digitar esses caracteres distorcidos

[17] 00:50is to prevent scalpers from writing a program
é para prevenir cambistas de escreverem um programa

[18] 00:52that can buy millions of tickets, two at a time.
que pode comprar milhões de ingressos, 2 por vez.

[19] 00:54CAPTCHAs are used all over the Internet.
CAPTCHAs são usados por toda internet.

[20] 00:56And since they're used so often,
E como são usados tão frequentemente,

[21] 00:58a lot of times the precise sequence of random characters that is shown to the user
muitas vezes a sequência aleatória de caracteres que é mostrada ao usuário

[22] 01:00is not so fortunate.
não é muito favorável.

[23] 01:02So this is an example from the Yahoo registration page.
Assim este exemplo é da página de registro do Yahoo.

[24] 01:05The random characters that happened to be shown to the user
Os caracteres aleatórios que acabaram sendo exibidos ao usuário

[25] 01:07were W, A, I, T, which, of course, spell a word.
foram W, A, I, T, que, em inglês, forma a palavra "espere".

[26] 01:10But the best part is the message
Mas a melhor parte desta mensagem

[27] 01:13that the Yahoo help desk got about 20 minutes later.
foi a que o setor de ajuda do Yahoo recebeu 20 minutos depois.

[28] 01:16Text: "Help! I've been waiting for over 20 minutes, and nothing happens."
Texto: "Ajuda! Estou esperando a mais de 20 minutos, e nada acontece."

[29] 01:19(Laughter)
(Risadas)

[30] 01:23This person thought they needed to wait.
Esta pessoa pensou que precisava esperar.

[31] 01:25This of course, is not as bad as this poor person.
Isto é claro, não é tão ruim como esta pobre pessoa.

[32] 01:28(Laughter)
(Risadas)

[33] 01:30CAPTCHA Project is something that we did here at Carnegie Melllon over 10 years ago,
O Projeto CAPTCHA é algo que fizemos aqui na Carnegie Melllon mais de 10 anos atrás,

[34] 01:33and it's been used everywhere.
e tem sido usado em toda parte.

[35] 01:35Let me now tell you about a project that we did a few years later,
Deixe-me agora contar-lhes sobre um projeto que fizemos alguns anos atrás,

[36] 01:37which is sort of the next evolution of CAPTCHA.
que é como uma evolução do CAPTCHA.

[37] 01:40This is a project that we call reCAPTCHA,
Este é um projeto que chamamos reCAPTCHA,

[38] 01:42which is something that we started here at Carnegie Mellon,
que é algo que começamos na Carnegie Mellon,

[39] 01:44then we turned it into a startup company.
então nós o transformamos em uma empresa voltada a alta tecnologia.

[40] 01:46And then about a year and a half ago,
E cerca de um ano e meio atrás,

[41] 01:48Google actually acquired this company.
Google adquiriu esta companhia.

[42] 01:50So let me tell you what this project started.
Assim deixe-me contar-lhes o que este projeto iniciou.

[43] 01:52So this project started from the following realization:
Então este projeto começou a partir da seguinte percepção:

[44] 01:55It turns out that approximately 200 million CAPTCHAs
Acontece que aproximadamente 200 milhões de CAPTCHAs

[45] 01:57are typed everyday by people around the world.
são digitadas todos os dias por pessoas em todo mundo.

[46] 02:00When I first heard this, I was quite proud of myself.
Quando ouvi isso a primeira vez, fiquei muito orgulhoso.

[47] 02:02I thought, look at the impact that my research has had.
Pensei, veja o impacto que a minha pesquisa teve.

[48] 02:04But then I started feeling bad.
Mas aí eu comecei a me sentir mal.

[49] 02:06See here's the thing, each time you type a CAPTCHA,
Veja aqui esta a coisa, toda vez que você digita um CAPTCHA,

[50] 02:08essentially you waste 10 seconds of your time.
essencialmente você perde 10 segundos do seu tempo.

[51] 02:11And if you multiply that by 200 million,
E se você multiplicar isso por 200 milhões,

[52] 02:13you get that humanity as a whole is wasting about 500,000 hours every day
você percebe que a humanidade como um todo está gastando 500.000 horas todo dia

[53] 02:16typing these annoying CAPTCHAs.
digitando esses chatos CAPTCHAs.

[54] 02:18So then I started feeling bad.
Então comecei a me sentir mal.

[55] 02:20(Laughter)
(Risadas)

[56] 02:22And then I started thinking, well, of course, we can't just get rid of CAPTCHAs,
E então comecei a pensar, bem, é claro, não podemos nos livrar dos CAPTCHAs,

[57] 02:25because the security of the Web sort of depends on them.
porque de certa forma a segurança na Web depende disso.

[58] 02:27But then I started thinking, is there any way we can use this effort
Mas então eu comecei a pensar, existe alguma forma de usarmos esse empenho

[59] 02:30for something that is good for humanity?
para algo que seja bom para a humanidade?

[60] 02:32So see, here's the thing.
Então veja, aqui está.

[61] 02:34While you're typing a CAPTCHA, during those 10 seconds,
Enquanto você está digitando um CAPTCHA, durante estes 10 segundos,

[62] 02:36your brain is doing something amazing.
seu cérebro está fazendo algo extraordinário.

[63] 02:38Your brain is doing something that computers cannot yet do.
Seu cérebro está fazendo algo que computadores não podem fazer.

[64] 02:40So can we get you to do useful work for those 10 seconds?
Assim será que conseguimos fazer você produzir algo útil nesses 10 segundos?

[65] 02:43Another way of putting it is,
Outra forma de explicar isso é,

[66] 02:45is there some humongous problem that we cannot yet get computers to solve,
existem alguns problemas enormes que computadores não conseguem resolver,

[67] 02:47yet we can split into tiny 10-second chunks
mas que conseguimos dividir em pedaços de 10 segundos

[68] 02:50such that each time somebody solves a CAPTCHA
para que toda vez que alguém solucione um CAPTCHA

[69] 02:52they solve a little bit of this problem?
ele resolva uma pequena parte deste problema?

[70] 02:54And the answer to that is "yes," and this is what we're doing now.
E a resposta é "sim", e isto é o que estamos fazendo agora.

[71] 02:56So what you may not know is that nowadays while you're typing a CAPTCHA,
Assim o que talvez você não saiba é que hoje em dia enquanto você digita um CAPTCHA,

[72] 02:59not only are you authenticating yourself as a human,
não apenas você está se autenticando como humano,

[73] 03:01but in addition you're actually helping us to digitize books.
mas em adição você está realmente nos ajudando a digitalizar livros.

[74] 03:03So let me explain how this works.
Então deixem-me explicar como isso funciona.

[75] 03:05So there's a lot of projects out there trying to digitize books.
Existem muitos projetos por aí tentando digitalizar livros.

[76] 03:07Google has one. The Internet Archive has one.
Google tem um. O Internet Archive tem um.

[77] 03:10Amazon, now with the Kindle, is trying to digitize books.
Amazon, agora com o Kindle, está tentando digitalizar livros.

[78] 03:12Basically the way this works
Basicamente a forma como isso funciona

[79] 03:14is you start with an old book.
é você começa com um livro antigo.

[80] 03:16You've seen those things, right? Like a book?
Já viram essas coisas, certo? Tipo um livro?

[81] 03:18(Laughter)
(Risadas)

[82] 03:20So you start with a book, and then you scan it.
Então você começa com um livro, e aí você o scanneia.

[83] 03:22Now scanning a book
Agora scannear um livro

[84] 03:24is like taking a digital photograph of every page of the book.
é como tirar uma fotografia de cada página do livro.

[85] 03:26It gives you an image for every page of the book.
Ele te dá uma imagem para cada página do livro.

[86] 03:28This is an image with text for every page of the book.
Esta é uma imagem com texto de cada página do livro.

[87] 03:30The next step in the process
O próximo passo no processo

[88] 03:32is that the computer needs to be able to decipher all of the words in this image.
é que o computador precisa ser capaz de decifrar todas as palavras nesta imagem.

[89] 03:35That's using a technology called OCR,
Isto usando uma tecnologia chamada OCR,

[90] 03:37for optical character recognition,
que significa reconhecimento ótico de caractere,

[91] 03:39which takes a picture of text
que tira uma foto do texto

[92] 03:41and tries to figure out what text is in there.
e tenta descobrir que texto está ali.

[93] 03:43Now the problem is that OCR is not perfect.
O problema é que OCR não é perfeito.

[94] 03:45Especially for older books
Especialmente em livros antigos

[95] 03:47where the ink has faded and the pages have turned yellow,
em que a tinta desbotou e as páginas ficaram amarelas,

[96] 03:50OCR cannot recognize a lot of the words.
OCR não consegue reconhecer muitas das palavras.

[97] 03:52For example, for things that were written more than 50 years ago,
Por exemplo, para coisas que foram escritas a mais de 50 anos atrás,

[98] 03:54the computer cannot recognize about 30 percent of the words.
o computador não consegue reconhecer 30% das palavras.

[99] 03:57So what we're doing now
Assim o que estamos fazendo agora

[100] 03:59is we're taking all of the words that the computer cannot recognize
é pegar todas as palavras que o computador não reconhece

[101] 04:01and we're getting people to read them for us
e estamos fazendo com que pessoas as leiam para nós

[102] 04:03while they're typing a CAPTCHA on the Internet.
enquanto elas digitam um CAPTCHA na internet.

[103] 04:05So the next time you type a CAPTCHA, these words that you're typing
Assim, na próxima vez que você digitar um CAPTCHA , as palavras que você está digitando

[104] 04:08are actually words that are coming from books that are being digitized
são na verdade palavras vindas de livros que estão sendo digitalizados

[105] 04:11that the computer could not recognize.
que o computador não reconheceu.

[106] 04:13And now the reason we have two words nowadays instead of one
E agora o motivo pelo qual temos 2 palavras atualmente ao invés de uma

[107] 04:15is because, you see, one of the words
é porque, veja você, uma das palavras

[108] 04:17is a word that the system just got out of a book,
é uma palavra que o sistema acabou de tirar de um livro,

[109] 04:19it didn't know what it was, and it's going to present it to you.
ele não sabe o que é, e ele irá apresentá-la a você.

[110] 04:22But since it doesn't know the answer for it, it cannot grade it for you.
Mas como ele não sabe a resposta para ela, ele não pode te avaliar.

[111] 04:25So what we do is we give you another word,
Assim o que fazemos é dar a você outra palavra,

[112] 04:27one for which the system does know the answer.
uma que o sistema conheça a resposta.

[113] 04:29We don't tell you which one's which, and we say, please type both.
Nós não te contamos qual é qual, e dizemos, favor digitar as duas.

[114] 04:31And if you type the correct word
E se você digitar a palavra certa

[115] 04:33for the one for which the system already knows the answer,
para uma das palavras que o sistema já conhece a resposta,

[116] 04:35it assumes you are human,
ele assume que você é humano,

[117] 04:37and it also gets some confidence that you typed the other word correctly.
e ele também confia que você digitou a outra palavra corretamente.

[118] 04:39And if we repeat this process to like 10 different people
E se repetirmos esse processo para 10 diferentes pessoas

[119] 04:42and all of them agree on what the new word is,
e todas elas concordem qual é a palavra nova,

[120] 04:44then we get one more word digitized accurately.
assim conseguimos mais uma palavra precisamente digitalizada.

[121] 04:46So this is how the system works.
Então é assim que o sistema funciona.

[122] 04:48And basically, since we released it about three or four years ago,
E basicamente, já que lançamos isto cerca de 3 ou 4 anos atrás,

[123] 04:51a lot of websites have started switching
muitos websites começaram a trocar

[124] 04:53from the old CAPTCHA where people wasted their time
o antigo CAPTCHA em que as pessoas perdiam seu tempo

[125] 04:55to the new CAPTCHA where people are helping to digitize books.
para o novo CAPTCHA em que as pessoas ajudam a digitalizar livros.

[126] 04:57So for example, Ticketmaster.
Assim por exemplo, Ticketmaster.

[127] 04:59So every time you buy tickets on Ticketmaster, you help to digitize a book.
Toda vez que você comprar ingressos pelo Ticketmaster, você está ajudando a digitalizar um livro.

[128] 05:02Facebook: Every time you add a friend or poke somebody,
Facebook: Toda vez que você adiciona um amigo ou cutuca alguém,

[129] 05:04you help to digitize a book.
você está ajudando a digitalizar um livro.

[130] 05:06Twitter and about 350,000 other sites are all using reCAPTCHA.
Twitter e cerca de 350.000 outros sites todos usam reCAPTCHA.

[131] 05:09And in fact, the number of sites that are using reCAPTCHA is so high
E na verdade, o número de sites usando reCAPTCHA é tão alto

[132] 05:11that the number of words that we're digitizing per day is really, really large.
que o número de palavras que são digitalizadas por dia é realmente, relamente grande.

[133] 05:14It's about 100 million a day,
É cerca de 100 milhões por dia,

[134] 05:16which is the equivalent of about two and a half million books a year.
o que é o equivalente a 2,5 milhões de livros por ano.

[135] 05:20And this is all being done one word at a time
E tudo isto tem sido feito uma palavra por vez

[136] 05:22by just people typing CAPTCHAs on the Internet.
somente por pessoas digitando CAPTCHAs na internet.

[137] 05:24(Applause)
(Aplausos)

[138] 05:32Now of course,
Agora é claro,

[139] 05:34since we're doing so many words per day,
já que estamos fazendo tantas palavras por dia,

[140] 05:36funny things can happen.
coisas engraçadas podem acontecer.

[141] 05:38And this is especially true because now we're giving people
E isto é especialmente verdadeiro porque agora estamos dando às pessoas

[142] 05:40two randomly chosen English words next to each other.
2 palavras aleatórias em inglês próximas uma da outra.

[143] 05:42So funny things can happen.
Assim coisas engraçadas podem acontecer.

[144] 05:44For example, we presented this word.
Por exemplo, apresentamos esta palavra.

[145] 05:46It's the word "Christians"; there's nothing wrong with it.
É a palavra "Cristãos"; não há nada de errado com ela.

[146] 05:48But if you present it along with another randomly chosen word,
Mas se apresentarmos junto com outra palavra escolhida aleatoriamente,

[147] 05:51bad things can happen.
coisas ruins podem acontecer.

[148] 05:53So we get this. (Text: bad christians)
Assim chegamos nisso. (Texto: maus cristãos)

[149] 05:55But it's even worse, because the particular website where we showed this
Mas é ainda pior, porque o site em particular em que isso apareceu

[150] 05:58actually happened to be called The Embassy of the Kingdom of God.
é de fato chamado A Embaixada do Reino de Deus.

[151] 06:01(Laughter)
(Risadas)

[152] 06:03Oops.
Oops.

[153] 06:05(Laughter)
(Risadas)

[154] 06:08Here's another really bad one.
Aqui está outra realmente ruim.

[155] 06:10JohnEdwards.com
JohnEdwards.com

[156] 06:12(Text: Damn liberal)
(Texto: Maldito liberal)

[157] 06:15(Laughter)
(Risadas)

[158] 06:17So we keep on insulting people left and right everyday.
Assim continuamos a insultar pessoas aqui e ali todo dia.

[159] 06:20Now, of course, we're not just insulting people.
Agora, é claro, não estamos insultando pessoas.

[160] 06:22See here's the thing, since we're presenting two randomly chosen words,
Veja aqui está a coisa, desde que apresentamos 2 palavras escolhidas aleatoriamente,

[161] 06:25interesting things can happen.
coisas interessantes acontecem.

[162] 06:27So this actually has given rise
Assim isso realmente tem dado origem

[163] 06:29to a really big Internet meme
a uma enorme transmissão cultural via internet

[164] 06:32that tens of thousands of people have participated in,
que dezenas de milhares de pessoas têm participado,

[165] 06:34which is called CAPTCHA art.
que é chamado arte CAPTCHA.

[166] 06:36I'm sure some of you have heard about it.
Tenho certeza que alguns de vocês já ouviram falar disso.

[167] 06:38Here's how it works.
Isto funciona assim.

[168] 06:40Imagine you're using the Internet and you see a CAPTCHA
Imagine que voê está usando a internet e você vê um CAPTCHA

[169] 06:42that you think is somewhat peculiar,
que você acredita ser de alguma forma peculiar,

[170] 06:44like this CAPTCHA. (Text: invisible toaster)
como este CAPTCHA. (Texto: torradeira invisível)

[171] 06:46Then what you're supposed to do is you take a screen shot of it.
Assim o que você deve fazer é tirar uma foto da tela.

[172] 06:48Then of course, you fill out the CAPTCHA
Então é claro, você preenche seu CAPTCHA

[173] 06:50because you help us digitize a book.
porque você está nos ajudando a digitalizar um livro.

[174] 06:52But then, first you take a screen shot,
Mas então, primeiro você tira uma foto da tela,

[175] 06:54and then you draw something that is related to it.
e então você desenha algo relacionado com ela.

[176] 06:56(Laughter)
(Risadas)

[177] 06:58That's how it works.
É assim que funciona.

[178] 07:01There are tens of thousands of these.
Existem dezenas de milhares destes.

[179] 07:04Some of them are very cute. (Text: clenched it)
Alguns são muito fofos. (Texto: Aperte isso)

[180] 07:06(Laughter)
(Risadas)

[181] 07:08Some of them are funnier.
Alguns são mais engraçados.

[182] 07:10(Text: stoned founders)
(Texto: fundadores chapados)

[183] 07:13(Laughter)
(Risadas)

[184] 07:16And some of them,
E alguns deles,

[185] 07:18like paleontological shvisle,
como uma sequência paleontológica de letras,

[186] 07:21they contain Snoop Dogg.
contém Snoop Dogg.

[187] 07:23(Laughter)
(Risadas)

[188] 07:26Okay, so this is my favorite number of reCAPTCHA.
Ok, então este é o meu número favorito de reCAPTCHA.

[189] 07:28So this is the favorite thing that I like about this whole project.
Então isto é minha coisa favorita de todo este projeto.

[190] 07:31This is the number of distinct people
Este é o número de pessoas distintas

[191] 07:33that have helped us digitize at least one word out of a book through reCAPTCHA:
que nos ajudaram a digitalizar pelo menos uma palavra de um livro através do reCAPTCHA

[192] 07:36750 million,
750 milhões,

[193] 07:38which is a little over 10 percent of the world's population,
que é um pouco mais de 10% da população mundial,

[194] 07:40has helped us digitize human knowledge.
nos ajudou a digitalizar o conhecimento humano.

[195] 07:42And it is numbers like these that motivate my research agenda.
E são números como este que motivam minha agenda de pesquisa.

[196] 07:45So the question that motivates my research is the following:
Assim a questão que motiva minha pesquisa é a seguinte:

[197] 07:48If you look at humanity's large-scale achievements,
Se você olhar para as conquitas humanas em larga escala,

[198] 07:50these really big things
essas coisas realmente enormes

[199] 07:52that humanity has gotten together and done historically --
que a humanidade se juntou e realizou historicamente --

[200] 07:55like for example, building the pyramids of Egypt
como por exemplo, construir as pirâmides do Egito

[201] 07:57or the Panama Canal
ou o Canal do Panamá

[202] 07:59or putting a man on the Moon --
ou colocar o homem na Lua --

[203] 08:01there is a curious fact about them,
existem fatos curiosos sobre isso,

[204] 08:03and it is that they were all done with about the same number off people.
e é que todos elas foram feitas quase com o mesmo número de pessoas.

[205] 08:05It's weird; they were all done with about 100,000 people.
É estranho; todas elas foram feitas com cerca de 100.000 pessoas.

[206] 08:08And the reason for that is because, before the Internet,
E a razão para isso é porque, antes da internet,

[207] 08:11coordinating more than 100,000 people,
coordenar mais de 100.000 pessoas,

[208] 08:13let alone paying them, was essentially impossible.
muito menos pagá-las, era essencialmente impossível.

[209] 08:16But now with the Internet, I've just shown you a project
Mas agora com a internet, acabo de mostrar-lhes um projeto

[210] 08:18where we've gotten 750 million people
em que tivemos 750 milhões de pessoas

[211] 08:20to help us digitize human knowledge.
nos ajudando a digitalizar o conhecimento humano.

[212] 08:22So the question that motivates my research is,
Assim a pergunta que motiva minha pesquisa é,

[213] 08:24if we can put a man on the Moon with 100,000,
se conseguimos colocar o homem na Lua com 100.000

[214] 08:27what can we do with 100 million?
o que podemos fazer com 100 milhões?

[215] 08:29So based on this question,
Assim baseado nesta questão,

[216] 08:31we've had a lot of different projects that we've been working on.
temos diferentes projetos em que estamos trabalhando.

[217] 08:33Let me tell you about one that I'm most excited about.
Deixem-me ocntar-lhe sobre um que estou mais empolgado.

[218] 08:36This is something that we've been semi-quietly working on
Isto é algo que estamos trabalhando semi-quietos

[219] 08:38for the last year and a half or so.
mais ou menos no último ano e meio.

[220] 08:40It hasn't yet been launched. It's called Duolingo.
Anda não foi lançado. É chamdo Duolingo.

[221] 08:42Since it hasn't been launched, shhhhh!
Já que não foi lançado, shhhhhhh!

[222] 08:44(Laughter)
(Risadas)

[223] 08:46Yeah, I can trust you'll do that.
Sim, posso confiar que farão isso.

[224] 08:48So this is the project. Here's how it started.
Então este é o projeto. Aqui é como começou.

[225] 08:50It started with me posing a question to my graduate student,
Começou comigo perguntando a meu aluno de graduação,

[226] 08:52Severin Hacker.
Severin Hacker.

[227] 08:54Okay, that's Severin Hacker.
Ok, este é Severin Hacker.

[228] 08:56So I posed the question to my graduate student.
Então fiz a pergunta a meu aluno de graduação.

[229] 08:58By the way, you did hear me correctly;
E sim, você me ouviram corretamente;

[230] 09:00his last name is Hacker.
o sobrenome dele é Hacker.

[231] 09:02So I posed this question to him:
Então fiz esta pergunta a ele:

[232] 09:04How can we get 100 million people
Como podemos conseguir 100 milhões de pessoas

[233] 09:06translating the Web into every major language for free?
traduzindo a Web nas principais línguas gratuitamente?

[234] 09:09Okay, so there's a lot of things to say about this question.
Ok, tem muitas coisas a serem ditas sobre esta pergunta.

[235] 09:11First of all, translating the Web.
Primeiro, traduzir a Web.

[236] 09:13So right now the Web is partitioned into multiple languages.
Atualmente a Web é dividida em diversas línguas.

[237] 09:16A large fraction of it is in English.
Uma grande fração dela é em Inglês.

[238] 09:18If you don't know any English, you can't access it.
Se você não conhece inglês, você não tem acesso a ela.

[239] 09:20But there's large fractions in other different languages,
Mas existem grandes frações em outras línguas diferentes,

[240] 09:22and if you don't know those languages, you can't access it.
e se você não conhece essas línguas, você não tem acesso a ela.

[241] 09:25So I would like to translate all of the Web, or at least most of the Web,
Assim eu gostaria de traduzir toda a Web, ou pelo menos a maiorira da Web,

[242] 09:28into every major language.
em cada língua principal.

[243] 09:30So that's what I would like to do.
Então é isso que gostaria de fazer.

[244] 09:32Now some of you may say, why can't we use computers to translate?
Agora alguns de vocês podem dizer, porque não usamos computadores para traduzir?

[245] 09:35Why can't we use machine translation?
Porque não usamos uma máquina de tradução?

[246] 09:37Machine translation nowadays is starting to translate some sentences here and there.
Máquinas de tradução hoje em dia estão começando a traduzir algumas frases aqui e ali.

[247] 09:39Why can't we use it to translate the whole Web?
Porque não a usamos para traduzir toda a Web?

[248] 09:41Well the problem with that is that it's not yet good enough
Bem o problema com isso é que ainda não é bom o suficiente

[249] 09:43and it probably won't be for the next 15 to 20 years.
e provavelmente não o será nos próximos 15 a 20 anos.

[250] 09:45It makes a lot of mistakes.
Ela erra muito.

[251] 09:47Even when it doesn't make a mistake,
Mesmo quando não erra,

[252] 09:49since it makes so many mistakes, you don't know whether to trust it or not.
como faz muitos erros, você não sabe se deve confiar ou não.

[253] 09:52So let me show you an example
Então deixe-me lhes mostrar um exemplo

[254] 09:54of something that was translated with a machine.
de algo que foi traduzido com uma máquina.

[255] 09:56Actually it was a forum post.
Na verdade eram posts de forum.

[256] 09:58It was somebody who was trying to ask a question about JavaScript.
Era alguém que estava tentando perguntar algo sobre JavaScript.

[257] 10:01It was translated from Japanese into English.
Foi traduzido do japonês para o inglês.

[258] 10:04So I'll just let you read.
Vou apenas deixá-los ler.

[259] 10:06This person starts apologizing
Esta pessoa começa se desculpando

[260] 10:08for the fact that it's translated with a computer.
pelo fato do texto ser traduzido por um computador.

[261] 10:10So the next sentence is is going to be the preamble to the question.
Então a próxima frase será a introdução da questão.

[262] 10:13So he's just explaining something.
Então ele está explicando algo.

[263] 10:15Remember, it's a question about JavaScript.
Lembrem-se é uma questão sobre JavaScript.

[264] 10:19(Text: At often, the goat-time install a error is vomit.)
(Texto: Em frequentemente, o tempo cabra instala um erro é vômito.)

[265] 10:23(Laughter)
(Risadas)

[266] 10:27Then comes the first part of the question.
Então vem a primeira parte da questão.

[267] 10:30(Text: How many times like the wind, a pole, and the dragon?)
(Texto: Quantas vezes como o vento, um poste e um dragão?)

[268] 10:34(Laughter)
(Risadas)

[269] 10:36Then comes my favorite part of the question.
Aí vem minha parte favorita da questão.

[270] 10:39(Text: This insult to father's stones?)
(Texto: Isto insulta o pai das pedras?)

[271] 10:42(Laughter)
(Risadas)

[272] 10:44And then comes the ending, which is my favorite part of the whole thing.
E aí vem o final, que é minha parte favorita de tudo isso.

[273] 10:47(Text: Please apologize for your stupidity. There are a many thank you.)
(Texto: Por favor desculpe-se por sua estupidez. Existem muitos obrigados.)

[274] 10:51(Laughter)
(Risadas)

[275] 10:53Okay, so computer translation, not yet good enough.
Ok, então a tradução por computador, ainda não é boa o suficiente.

[276] 10:55So back to the question.
Assim de volta a questão.

[277] 10:57So we need people to translate the whole Web.
Então precisamos de pessoas para traduzir toda a Web.

[278] 11:00So now the next question you may have is,
Agora a próxima pergunta que vocês devem ter é,

[279] 11:02well why can't we just pay people to do this?
então porque nós simplesmente não pagamos pessoas para fazer isso?

[280] 11:04We could pay professional language translators to translate the whole Web.
Poderíamos pagar tradutores profissionais para traduzir toda a Web.

[281] 11:07We could do that.
Podemos fazer isso.

[282] 11:09Unfortunately, it would be extremely expensive.
Infelizmente, seria extremamente caro.

[283] 11:11For example, translating a tiny, tiny fraction of the whole Web, Wikipedia,
Por exemplo, traduzindo uma pequenina fração de toda a Web, Wikipedia,

[284] 11:14into one other language, Spanish.
em outra língua, Espanhol.

[285] 11:17Wikipedia exists in Spanish,
Wikipedia existe em espanhol,

[286] 11:19but it's very small compared to the size of English.
mas é muito pequena se comparada com a versão em inglês.

[287] 11:21It's about 20 percent of the size of English.
É cerca de 20% do tamanho da em inglês.

[288] 11:23If we wanted to translate the other 80 percent into Spanish,
Se quisermos traduzir os outros 80% em espanhol,

[289] 11:26it would cost at least 50 million dollars --
custaria pelo menos 50 milhões de dólares --

[290] 11:28and this is at even the most exploited, outsourcing country out there.
e isto no mais explorado, país terceirizado por aí.

[291] 11:31So it would be very expensive.
Assim seria muito caro.

[292] 11:33So what we want to do is we want to get 100 million people
Então o que queremos fazer é pegar 100 milhões de pessoas

[293] 11:35translating the Web into every major language
traduzindo a Web em cada língua principal

[294] 11:37for free.
de graça.

[295] 11:39Now if this is what you want to do,
Agora se é isto que você quer fazer,

[296] 11:41you pretty quickly realize you're going to run into two pretty big hurdles,
você provavelmente encontrará duas grandes barreiras,

[297] 11:43two big obstacles.
dois grandes obstáculos.

[298] 11:45The first one is a lack of bilinguals.
O primeiro é a falta de pessoas bilíngues.

[299] 11:48So I don't even know
Assim eu nem sei

[300] 11:50if there exists 100 million people out there using the Web
se existe por aí 100 milhões de pessoas usando a Web

[301] 11:53who are bilingual enough to help us translate.
que são bilíngues o suficiente para nos ajudar a traduzir.

[302] 11:55That's a big problem.
Isto é um grande problema.

[303] 11:57The other problem you're going to run into is a lack of motivation.
O outro problema que você encontrará é a falta de motivação.

[304] 11:59How are we going to motivate people
Como iremos motivar as pessoas

[305] 12:01to actually translate the Web for free?
para realmente traduzirem a Web de graça?

[306] 12:03Normally, you have to pay people to do this.
Normalmente, você deve pagar a pessoa para fazer isso.

[307] 12:06So how are we going to motivate them to do it for free?
Então como iremos motivá-las para fazer isto de graça?

[308] 12:08Now when we were starting to think about this, we were blocked by these two things.
Agora quando começamos a pensar nisso, fomos bloqueados por essas duas coisas.

[309] 12:11But then we realized, there's actually a way
Mas aí percebemos, que existe sim uma forma

[310] 12:13to solve both these problems with the same solution.
de resolver esses dois problemas com a mesma solução.

[311] 12:15There's a way to kill two birds with one stone.
Uma forma de matar dois pássaros com uma só pedra.

[312] 12:17And that is to transform language translation
E istó é transformar a tradução de línguas

[313] 12:20into something that millions of people want to do,
em algo que milhões de pessoas querem fazer,

[314] 12:23and that also helps with the problem of lack of bilinguals,
e isto também ajuda com o problema da falta de bilíngues,

[315] 12:26and that is language education.
e isto é educação de línguas.

[316] 12:29So it turns out that today,
Assim acontece que hoje em dia,

[317] 12:31there are over 1.2 billion people learning a foreign language.
existem mais de 1.2 milhões de pessoas aprendendo uma língua estrangeira.

[318] 12:34People really, really want to learn a foreign language.
Pessoas que realmente querem aprender uma língua estrangeira.

[319] 12:36And it's not just because they're being forced to do so in school.
E não é apenas porque elas estão sendo forçadas a isso na escola.

[320] 12:39For example, in the United States alone,
Por exemplo, apenas nos Estados Unidos,

[321] 12:41there are over five million people who have paid over $500
existem mais de 5 milhões de pessoas que pagaram mais de 500 dólares

[322] 12:43for software to learn a new language.
em softwares para aprender uma nova língua.

[323] 12:45So people really, really want to learn a new language.
Assim as pessoas realmente querem aprender uma nova língua.

[324] 12:47So what we've been working on for the last year and a half is a new website --
Então o que estamos trabalhando no último ano e meio é um novo site --

[325] 12:50it's called Duolingo --
chamdo Duolingo --

[326] 12:52where the basic idea is people learn a new language for free
em que a ideia básica é que as pessoas aprendem uma nova língua de graça

[327] 12:55while simultaneously translating the Web.
enquanto simultaneamente traduzem a Web.

[328] 12:57And so basically they're learning by doing.
E então basicamente elas estão aprendendo fazendo.

[329] 12:59So the way this works
Assim a forma como isso funciona

[330] 13:01is whenever you're a just a beginner, we give you very, very simple sentences.
é que desde quando você é um iniciante, lhes damos frases muito simples.

[331] 13:04There's, of course, a lot of very simple sentences on the Web.
Existem, é claro, muitas frases simples na Web.

[332] 13:06We give you very, very simple sentences
Lhes damos frases muito, muito simples

[333] 13:08along with what each word means.
junto com o significado de cada palavra.

[334] 13:10And as you translate them, and as you see how other people translate them,
E quando você as traduz, e ao ver como outras pessoas as traduzem,

[335] 13:13you start learning the language.
você começa a aprender a língua.

[336] 13:15And as you get more and more advanced,
E ao se tornar mais e mais avançado,

[337] 13:17we give you more and more complex sentences to translate.
lhes damos frases mais e mais complexas para traduzir.

[338] 13:19But at all times, you're learning by doing.
Mas todas as vezes, você aprende fazendo.

[339] 13:21Now the crazy thing about this method
Agora a coisa mais doida sobre este método

[340] 13:23is that it actually really works.
é que realmente funciona.

[341] 13:25First of all, people are really, really learning a language.
Primeiro, as pessoas realmente estao aprendendo uma língua.

[342] 13:27We're mostly done building it, and now we're testing it.
Nós praticamente acabamos de construir, e agora estamos testando.

[343] 13:29People really can learn a language with it.
Pessoas realmente podem aprender uma língua com isto.

[344] 13:31And they learn it about as well as the leading language learning software.
E eles aprendem tão bem quanto com os softwares de ensino de línguas.

[345] 13:34So people really do learn a language.
Assim as pessoas realmente aprendem uma língua.

[346] 13:36And not only do they learn it as well,
E não apenas a aprendem bem,

[347] 13:38but actually it's way more interesting.
mas de uma forma mais interessante.

[348] 13:40Because you see with Duolingo, people are actually learning with real content.
Porque com Duolingo, as pessoas aprendem realmente com um conteúdo real.

[349] 13:43As opposed to learning with made-up sentences,
Ao contrário de aprenderem com frases inventadas,

[350] 13:45people are learning with real content, which is inherently interesting.
as pessoas estão aprendendo com conteúdo real o que é inerentemente interessante.

[351] 13:48So people really do learn a language.
Assim as pessoas realmente aprendem uma língua.

[352] 13:50But perhaps more surprisingly,
Mas talvez o mais surpreendente,

[353] 13:52the translations that we get from people using the site,
as traduções que obtemos das pessoas que usam o site,

[354] 13:55even though they're just beginners,
ainda que sejam inciantes,

[355] 13:57the translations that we get are as accurate as those of professional language translators,
as traduções que obtemos são tão precisas quanto as de um tradutor profissional,

[356] 14:00which is very surprising.
o que é muito surpreendente.

[357] 14:02So let me show you one example.
Assim deixem-me mostrar-lhes um exemplo.

[358] 14:04This is a sentence that was translated from German into English.
Esta é uma frase que foi traduzida do alemão para o inglês.

[359] 14:06The top is the German.
No alto está o alemão.

[360] 14:08The middle is an English translation
No meio está a tradução em inglês

[361] 14:10that was done by somebody who was a professional English translator
ela foi feita por alguém que é um tradutor profissional

[362] 14:12who we paid 20 cents a word for this translation.
que pagamos 20 centavos a palavra por esta tradução.

[363] 14:14And the bottom is a translation by users of Duolingo,
E embaixo está a tradução de usuários do Duolingo,

[364] 14:17none of whom knew any German
nenhum deles conhecia nada de alemão

[365] 14:19before they started using the site.
antes de começarem a usar este site.

[366] 14:21You can see, it's pretty much perfect.
Como podem ver, está praticamente perfeita.

[367] 14:23Now of course, we play a trick here
Agora, é claro, fizemos um truque aqui

[368] 14:25to make the translations as good as professional language translators.
para tornar as traduções tão boas quanto as de tradutores profissionais.

[369] 14:27We combine the translations of multiple beginners
Combinamos as traduções de diversos iniciantes

[370] 14:30to get the quality of a single professional translator.
para chegar a qualidade de um tradutor profissional.

[371] 14:33Now even though we're combining the translations,
Agora mesmo que estejamos combinando traduções,

[372] 14:38the site actually can translate pretty fast.
o site realmente pode traduzir rapidamente.

[373] 14:40So let me show you,
Então deixem-me mostrar-lhes,

[374] 14:42this is our estimates of how fast we could translate Wikipedia
esta é nossa estimativa de quão rápido podemos traduzir a Wikipedia

[375] 14:44from English into Spanish.
de inglês para espanhol.

[376] 14:46Remember, this is 50 million dollars-worth of value.
Lembre-se, isto vale 50 milhões dólares.

[377] 14:49So if we wanted to translate Wikipedia into Spanish,
Então se queremos traduzir a Wikipedia em espanhol,

[378] 14:51we could do it in five weeks with 100,000 active users.
podemos fazer isto em 5 semanas com 100 mil usuários ativos.

[379] 14:54And we could do it in about 80 hours with a million active users.
E poderíamos fazer isto em cerca de 80 horas com um milhão de usuários ativos.

[380] 14:57Since all the projects that my group has worked on so far have gotten millions of users,
Partindo do princípio que todos os projetos que meu grupo trabalhou até então tiveram milhões de usuários,

[381] 15:00we're hopeful that we'll be able to translate
estamos esperançosos em podermos traduzir

[382] 15:02extremely fast with this project.
extremamente rápido com este projeto.

[383] 15:04Now the thing that I'm most excited about with Duolingo
Agora a coisa que estou mais animado com o Duolingo

[384] 15:07is I think this provides a fair business model for language education.
é que acredito que ele disponibiliza um modelo de negócio para o ensino de línguas.

[385] 15:10So here's the thing:
Então aqui está:

[386] 15:12The current business model for language education
O modelo atual de negócio para ensino de línguas

[387] 15:14is the student pays,
é aquele em que o estudante paga,

[388] 15:16and in particular, the student pays Rosetta Stone 500 dollars.
e particularmente, o estudante paga ao software Rosetta Stone 500 dólares.

[389] 15:18(Laughter)
(Risadas)

[390] 15:20That's the current business model.
Este é o modelo de negócios atual.

[391] 15:22The problem with this business model
O problema com este modelo de negócio

[392] 15:24is that 95 percent of the world's population doesn't have 500 dollars.
é que 95% da população mundial não possui 500 dólares.

[393] 15:27So it's extremely unfair towards the poor.
Então é extremamente injusto com os pobres.

[394] 15:30This is totally biased towards the rich.
Isto é totalmente direcionado aos ricos.

[395] 15:32Now see, in Duolingo,
Agora vejam, com Duolingo,

[396] 15:34because while you learn
porque enquanto você aprende

[397] 15:36you're actually creating value, you're translating stuff --
você realmente cria valor, você está traduzindo coisas --

[398] 15:39which for example, we could charge somebody for translations.
o que por exemplo, nós poderíamos cobrar de alguém pela traduções.

[399] 15:42So this is how we could monetize this.
Então é assim que podemos rentabilizar isto.

[400] 15:44Since people are creating value while they're learning,
Já que as pessoas estão criando valor enquanto aprendem,

[401] 15:46they don't have to pay their money, they pay with their time.
elas não precisam pagar com seu dinheiro, elas pagam com seu tempo.

[402] 15:49But the magical thing here is that they're paying with their time,
Mas a mágica aqui é que elas estão pagando com seu tempo,

[403] 15:52but that is time that would have had to have been spent anyways
mas este é um tempo que estaria sendo gasto de qualquer forma

[404] 15:54learning the language.
no aprendizando de uma língua.

[405] 15:56So the nice thing about Duolingo is I think it provides a fair business model --
O bom do Duolingo é que acredito que ele disponibiliza um modelo de negócios justo --

[406] 15:59one that doesn't discriminate against poor people.
um que não discrimina as pessoas pobres.

[407] 16:01So here's the site. Thank you.
Então aqui está o site. Obrigado.

[408] 16:03(Applause)
(Aplausos)

[409] 16:11So here's the site.
Então aqui está o site.

[410] 16:13We haven't yet launched,
Ainda não lançamos,

[411] 16:15but if you go there, you can sign up to be part of our private beta,
mas se você acessá-lo, poderá se registrar para fazer parte da versão beta privada,

[412] 16:18which is probably going to start in about three or four weeks.
que provavelmente começará em 3 ou 4 semanas.

[413] 16:20We haven't yet launched this Duolingo.
Ainda não lançamos este Duolingo.

[414] 16:22By the way, I'm the one talking here,
Por sinal, sou eu quem está falando aqui,

[415] 16:24but actually Duolingo is the work of a really awesome team, some of whom are here.
mas na verdade Duolingo é o trabalho de uma equipe fantástica e certos membros estão aqui.

[416] 16:27So thank you.
Então, obrigado.

[417] 16:29(Applause)
(Aplausos)