Finding a voice Technology Quarterly - The Economist Jan 7th 2017
07 Jan 2017기사 정보를 받아오는 중입니다...
(여기를 눌러 기사를 보러 갈 수 있습니다.)Ⅰ Language: Finding a voice
-
Apple의 Siri, Amazon의 Alexa, Google의 Google Now, Microsoft의 Cortana의 공통점은 무엇일까요?
-
1960년대 후반부터 미국 정부가 20년 동안 언어 기술 연구(language technology research)에 대한 투자를 동결한 원인은 John Pierce가 작성한 보고서 때문입니다. John Pierce가 이 보고서를 작성하도록 위임 받은 이유는 무엇이고, 이 보고서의 내용은 무엇일까요?
-
1980년대 초반 Charles Wayne는 “공통 과업(common task)”이라는 새로운 언어 기술 연구 방법을 제창했습니다. Charles Wayne이 이러한 제안을 하게 된 배경과 연구자들이 동의한 “관행의 공통 집합(common set of practices)”이 무엇인지 설명해봅시다.
-
언어 기술의 역사에는 크게 세 가지 접근법이 등장합니다. 이 세 가지 접근법이 무엇인지 말해보고, 각각의 접근법에 대해 구체적으로 설명해봅시다.
-
chilling, turn on, pod bay door, sassy(=saucy), modest, call upon, corny, quip, sterling, scathing, hard-headed, salutary, workaday, consortium, a thing or two, in the dark, cul-de-sac, breakdown, metric, parity, brute force technology, scour, parse, come into one’s own, be poised to do, put off, tout, matter-of-fact, fine-tune, at a pinch(=on a pinch=in a pinch), work out의 의미를 사전에서 찾고 암기합시다.
Ⅱ Speech recognition: I hear you
-
원리적인 측면에서 음성 언어(spoken language)를 문자 언어(written language)로 전사하는 것은 쉬울 수 밖에 없습니다. 특히 영어는 음소(phoneme)가 44개 밖에 되지 않기 때문에 더욱 쉽습니다. 하지만 이론과 달리 실제는 그리 만만치 않습니다. 그 여섯 가지 이유는 무엇일까요?
-
그럼에도 음성 인식 소프트웨어(speech-recognition software)가 이러한 어려움을 극복할 수 있었던 네 가지 요인은 무엇일까요?
-
오늘날 사용되는 음성 인식 체계(speech-recognition system)가 놀라운 발전을 할 수 있었던 것은 네 가지 가장 중요한 특징 때문입니다. 이 네 가지 특징을 구체적으로 설명해봅시다.
-
음성 인식 기술이 여전히 극복하지 못하고 있는 문제는 무엇일까요?
-
말하는 컴퓨터는 인간의 말을 이해하는 컴퓨터가 작동하는 방식의 반대로 작동합니다. 그 작동 방식을 다른 말로 하면 음성 구조의 기본적인 모델이라고 합니다. 이 기본적인 모델에서 고려해야 할 사항은 무엇일까요?
-
말하는 컴퓨터는 “이끌다(lead)”와 “납(lead)”을 어떻게 구별할까요?
-
텍스트를 음성으로 바꾸는 모델은 연결형(concatenative model)과 매개변수형(parametric model)과 심층신경망(deep neural networks)이 있습니다. 이 세 모델에 대해 설명해봅시다.
-
말하는 컴퓨터가 마지막으로 극복해야 할 과제는 운율 체계(prosody)입니다. 운율 체계란 무엇이고, 왜 필요한가요?
-
formant, fleece, transcribe, phoneme, pat, puff, back to back, timbre, all the same, beam, odds(다양한 뜻이 있으니 모두 찾아봅시다), homophone, bare(여기서는 동사입니다), guesswork, phlebitis, gastrointestinal, look out for, benchmark, stall, in parallel, log, pick-up, idiosyncrasy, hasta la vista, Teutonic, inverse, approximation, burst, heteronym, concatenate, parameter, churn out, prosody, modulation, myriad, accentuation, jarring의 의미를 사전에서 찾고 암기합시다.
Ⅲ Machine translation: Beyond Babel
-
컴퓨터를 사용하여 외국어를 번역하려는 시도가 처음 등장한 것은 냉전 시대(cold war)였습니다. 이러한 시도는 어디에서 영감을 얻었고, 그 성과는 어땠나요?
-
기계 번역(machine translation)이 거둔 초기의 성과는 곧바로 다음 단계의 발전을 방해합니다. 기계 번역이 초기의 성과를 거둔 원인은 무엇이고, 그 원인이 곧바로 발전의 방해물이 된 이유는 무엇일까요?
-
이러한 한계를 극복하기 위해 IBM에서 사용한 방법은 무엇인가요? 또한 실질적으로 이러한 한계를 극복한 Google이 사용한 방법은 무엇인가요?
-
번역 모델(translation model)이란 무엇일까요?
-
기계 번역에 획기적인 발전을 가져온 신경망에 기초한 번역(neural-network-based translation)이 사용하는 두 개의 연결망(network)은 무엇일까요?
-
신경망 번역은 엄청난 계산 능력을 필요로 합니다. 심층 학습(deep learning)이 가능한 컴퓨터가 이러한 계산 능력을 갖추는 과정에서 결정적인 기여를 한 것은 무엇일까요?
-
기계 번역이 여전히 풀어야 할 숙제 네 가지는 무엇일까요?
-
기계 번역이 여전히 완벽하지는 않지만, (1) “Translation Memories” 소프트웨어나 (2) 좁은 실제 세계의 영역이나 (3) Microsoft의 Skype Translator나 (4) 번역 관리(translation management)나 (5) 사용자가 자신의 시스템을 향상시키도록 하는 방법 등에서는 일정한 성과를 거두고 있습니다. 이 다섯 분야에서 기계 번역이 거둔 성과를 설명해봅시다.
-
let alone, quaint, moniker(=monicker=monaker=monniker), scramble, Cyrilic, breezy, la plume de mon orniateur(=the quilt of my computer), bog, scale(여기서는 동사입니다), pen, stumble, bungle, setback, index, trawl, corpus, come by, more often than not, turn loose, a first, fizzy, heavy-duty, a long way off, on the ground, serve up, in-house, to hand, instantaneous, stake, hand-craft, detract, tweak, provocative의 의미를 사전에서 찾고 암기합시다.
Ⅳ Meaning and machine intelligence: What are you talking about?
-
컴퓨터가 아직도 인간과 진정한 대화를 하지 못하는 이유는 무엇일까요?
-
컴퓨터가 인간의 말을 이해하려면 인간의 말을 인식한 다음 문법과 의미에 맞게 분석해야 합니다. 인간의 언어를 문법에 맞게 분석하는 것을 “자연 언어 처리(natural-language processing)”라고 하고, 인간의 언어를 의미가 통하도록 이해하는 것을 “자연 언어 이해(natural-language understanding)”라고 합니다. 이 두 과정을 좀 더 자세히 설명해봅시다.
-
공공 분수대 옆의 표지판에 써 있는 “이 물은 마실 수 없습니다(This is not drinking water.)”라는 말을 컴퓨터는 어떻게 이해하나요? 이러한 컴퓨터의 오해를 극복하는 방법은 무엇일까요?
-
Groucho Marx의 농담 “어느 날 아침 내 잠옷 안에 있는 코끼리를 쏘았다. 어떻게 코끼리가 내 잠옷 안으로 들어왔는지 나는 절대 모를 것이다(One morning I shot an elephant in my pyjamas. How he got in my pyjamas, I’ll never know.)”를 컴퓨터가 이해하기 어려운 까닭은 무엇일까요? 또한 이를 극복하기 위해 어떤 방법을 사용하나요?
-
구문(syntax)보다 이해하기 어려운 것이 의미(meaning)입니다. 사례를 들어 설명해봅시다.
-
“누가 ‘Thor’에서 Thor 역을 했나?”라는 질문을 컴퓨터는 어떻게 이해하나요? 이러한 컴퓨터의 이해는 완벽하게 적절한 분석이지만, 어용론(pragmatics)에 어긋납니다. 이를 극복하는 방법은 무엇일까요?
-
Nuance에서 개발하고 있는 “관리인(concierge)” 프로그램에 대해 설명해봅시다.
-
인간의 말을 이해하는 컴퓨터를 만드는 작업이 음성 인식 기술과 기계 번역보다 어려운 두 가지 이유는 무엇일까요? 그리고 이러한 문제를 해결하기 위해 Cortical.io에서 개발하고 있는 창의적인 접근법은 무엇일까요?
-
인간과 기계가 대화하기 위해서는 극복해야 할 과제가 여럿입니다. 구체적으로 설명해봅시다.
-
컴퓨터의 이해력을 테스트하기 위해 만든 위노그래드 도식(Winograd Schemata)은 무엇일까요? 예를 들어 설명해봅시다.
-
Terry Winograd가 집중한 연구 과제를 차례로 설명해봅시다.
-
before long, eerie, Father Christmas, chitchat, heading, lexicalize(←lexical), eponymous, beefy, pragmatics, twists and turns, tricky, concierge, schemata, pose, crushing, jolt, fall out with, Methodist, node, query, flummox(=flummox), cortical, semantic, clump, disambiguate, in progress의 의미를 사전에서 찾고 암기합시다.
Ⅴ Looking ahead: For my next trick
-
언어는 인간의 본질이기 때문에, 언어를 구사하는 기계는 인간의 모든 특성을 구현할 수 밖에 없습니다. 말하는 기계가 구현할 수 밖에 없는 인간의 특성은 무엇일까요?
-
인간과 기계가 소통하는 과정은 두 단계의 도약을 거쳤고, 이제 세 번째 도약을 준비하고 있습니다. 이 세 단계를 차례로 설명해봅시다.
-
음성뿐만 아니라 문자도 미래에 컴퓨터를 운영하는 중요한 수단으로 남을 것입니다. 하지만 말로 컴퓨터를 운영하는 방식은 많은 사람들에게 도움을 줄 것입니다. 구체적으로 누구에게, 그리고 무엇에 도움이 될까요?
-
인간이 쓰는 언어를 구사하는 컴퓨터의 출현은 사생활 침해와 일자리 파괴라는 커다란 문제를 야기합니다. 왜 이런 문제가 생길 수 밖에 없는지 설명하고, 이 기사에서 제시하고 있는 해결책은 무엇인지 설명해봅시다.
-
trash, whisk around, morbid, malevolent, pipe up, tinkerer, pile, yammer, interlocutor, amyotrophic lateral sclerosis(ALS), immobilize, predictive, company(여기서는 “회사”나 “동료”라는 뜻이 아닙니다), far-flung, at stake, downside(↔upside), prompt, amount to, accelerometer, chemist, haemorrhoid(=hemorrhoids), script, bullish, biometrics, parameter, tedium, PIN(Personal Identification Number), get away with, vet(여기서는 동사입니다), the other way round, drudgery, paralegal, wrought, blur의 의미를 사전에서 찾고 암기합시다.