비폭력 정책 이론

철학자들이 왜 행복하게하기 위해 동의하는지.

Wikimedia commons.

출처 : 위키 미디어 커먼즈.

나는 부모님이 내게 “아들, 우리는 단지 당신이 행복하기를 바랍니다.”라고 결코 말하지 않았다는 것을 처음 알았을 때 대학 2 학년이었습니다. 다른 사람들의 부모님이 그들에게 뭐라고 하던지간에, 그것은 그들을 행복하게했습니다. 왜, 부모님이 내게 이런 말을하지 않았습니까?

존 스튜어트 밀 (John Stuart Mill) 자서전에서 한 절을 발견했을 때 나는 즉시 이해했다.

밀은 재미있는 사람 이었어. 그는 인간의 역사에서 가장 높은 지능 지수를 가졌지 만 (당시에는 지능 검사가 없었지만 심리학 적 역사가들은 다른 증거로 지능 지수를 재구성하려고 시도했습니다). 그의 아버지, 훌륭한 역사가 인 제임스 밀 (James Mill)은 세 살 때 고대 그리스인을 가르치기 시작했습니다. 여덟 살 때까지, 그는 헤롯 도스의 역사 전체를 원본에서 읽었습니다. 그래서 나는 그의 인생 이야기가 흥미 진진한 읽을 거리가 될 것이라고 생각했다. 그러나 그렇지 않습니다. 그의 자서전은 전체 스누즈 페스트입니다. 내가 회상 한 바와 같이,이 작업은 Mill이 읽거나 보거나 생각한 가장 흥미로운 것들을 철저하게 편집 한 것입니다. 대표적인 구절 : “정치 경제가 충분할 때 우리는 같은 방식으로 삼단 논법 논리를 채택했다. 우리의 첫 번째 교과서는 Aldrich 였지만 그 피상적 인면에 역겨워하면서, 우리는 학교 논리의 많은 매뉴얼 중 가장 완성 된 것 중 하나를 복각 시켰습니다. 나의 아버지, 그런 책의 위대한 수집가 인 Manuductio ad Logicam 은 예수회 뒤 트라이. 이것을 끝내고 우리는 Whately ‘s Logic을 취한 후, Metropolitana 백과 사전 에서 다시 출판하고, 마지막으로 Hobbes의 Computica Logic of Logic 을 재발행했습니다. 누가 신경 쓰겠 니?

왜 내가 정확히 모르겠지만, 나는 그것을 통해 터벅 터벅 걸었습니다. 그리고 나는 기뻤다.

그러나 밀이 행복에 관해 말한 것을 이해하기 위해서는 먼저 인공 지능의 개념을 이해해야합니다. 강화 학습이라고합니다.

강화 학습의 기본 아이디어는 간단합니다. 그것은 사람, 로봇, 컴퓨터 프로그램 등 지능적으로 행동하는 에이전트를 설계하는 방법입니다. 인텔리전스의 정의는 컴퓨터 과학자들이 “보상 최대화”라고 부르는 것입니다. 간단히 말해서, 당신이 원하는 것이 있고 지능적인 행동은 최대한 많은 것을 얻는 것입니다. 예를 들어, 상담원이 농구를하는 로봇 인 경우 보상은 포인트 형태로 제공됩니다. 로봇이 더 많은 바구니를 만들수록 더 많은 점수를 받고 더 똑똑하게 행동하게됩니다. 강화 학습은 로봇이 점점 더 많은 점을 얻는 법을 배우는 수학적 솔루션입니다.

보강 학습의 핵심은 “정책”입니다. 로봇의 플레이 북입니다. 정책은 수학적 추상화에서 “이것은 지금 내가있는 곳입니다. 이것은 내가 보상을 극대화하기 위해해야 ​​할 일이다. “농구의 경우 좋은 정책은 공을 가져다 바구니쪽으로 드리블시키고 레이 업을 던지는 것입니다. 로봇이 이것을 할 때마다, 그녀는 포인트를 얻는데 얼마나 효과적 이었는지를보고 다음 번에 더 잘할 수 있도록 행동을 조정합니다. 로봇이 나빠질 수도 있지만 보강 학습을 사용하면 시간이 지남에 따라 더 나아질 수 있습니다. 이것이 지능이 의미하는 바입니다. 시간이 지남에 따라 목표를 달성하는 데 더 나아졌습니다.

아이디어는 간단 할 수도 있지만, 보강 학습의 모든 뉘앙스는 당신이 그 정책을 어떻게 배우는 지 정확히 수 있습니다. 예를 들어 바스켓을 향한 최선의 정책은 무엇입니까? 아니면 앉아서 점퍼를 쏴야할까요? 다음에 더 잘할 수있는 방법을 어떻게 알 수 있습니까? 같은 정책이 다른 상대방에게 적용됩니까?

정책을 배우는 방법에는 두 가지 일반적인 전략이 있습니다. 첫 번째는 on-policy 라고 합니다 . 두 가지 전략 중 더 간단합니다. On-Policy는 로봇이 동일한 정보를 사용하여 의사 결정을 내리고 의사 결정 여부를 평가하는 것을 의미합니다. 그녀의 정책이 바스켓을 향해 나아가고 있다고 말하면 많은 점수를 얻게된다면 앞으로도 똑같은 정책으로 계속 나아갈 것입니다. 두 번째 전략은 오프 정책 이라고 합니다 . 이것은 로봇이 자신이 평가 한 것보다 다른 정보를 사용하여 의사 결정을 내리는 것을 의미합니다. 에이전트는 예를 들어 그녀가 볼을 소유 한 시간을 기반으로 결정을 내릴 수 있습니다. 그녀는 그 방침에 따라 그녀의 연극을 되돌아보고 다른 것에 집중하는 것이 결국 그녀의 바구니 수를 증가시키는지를 볼 수있었습니다.

처음에는 더 나은 전략이 항상 정책에 맞춰지는 것처럼 보일 수 있습니다. 완전히 무의미한 것에 초점을 맞춤으로써 어떻게 더 많은 점수를 얻을 수 있습니까? 하지만 반드시 그런 것은 아닙니다. 인공 지능 연구에서의 경험적 사실은 오프 – 정책 방법으로 어떤 문제가 더 잘 해결된다는 것입니다. 때로는 목표를 달성하는 가장 좋은 방법은 간접적 인 방법입니다.

이것은 밀이 행복에 관해 주장하는 것과 정확히 같습니다. 말하자면 행복을 극대화하는 방법은 다른 것을 목표로 삼는 것입니다. 자신을 자신의 행복보다 더 큰 것에 헌정하십시오. 그것으로 열심히 일하십시오. 그런 다음 다시 돌아보고 전체 시간 동안 행복을 누리고 있음을 깨닫게됩니다. 밀 작성,

“삶의 즐거움은 주된 목표가되지 않은 채 지나치게 즐거워지면 즐겁게 만들 수 있습니다. 일단 당신이 그들을 그렇게 만들면, 당신은 즉시 그들이 부족하다고 느낄 것입니다. 그들은 면밀한 조사를하지 않을 것입니다. 자신이 행복한지 물어보십시오. 유일한 기회는 당신이 인생의 목적이 아니라 행복의 목적을 갖는 것입니다. 당신의 자의식, 당신의 면밀한 조사, 당신의 자기 심문이 그들 자신을 피하게하십시오; 그렇지 않으면 다행스럽게 상황에 처한 경우, 숨을 쉬거나 생각하거나, 상상력을 터지거나, 치명적인 의문을 제기하여 공중에 숨을 쉬지 않고 숨 쉬는 공기로 행복을 느끼게됩니다.

다시 말해, 온 정책 전략은 행복을 위해 작동하지 않습니다. 그것을 극대화하려고한다면, 당신이 다른 접근법을 택한 것보다 더 나빠질 것입니다. 행복은 오프 – 정책 전략으로 더 잘 작동하는 문제 중 하나입니다. 행동과 평가는 분리되어야합니다. 다음 결정을 평가할 수있는 척도로서 자신의 행복을 사용한다면 관심의 범위는 자신의 감정을 넘어서지 못할 것입니다. 대신 자신보다 큰 무언가에 초점을 둔 밀 (Mill)을 주장하면서 당신 이 숨쉬는 공기로 행복 을 느끼는 것을 깨닫게됩니다.

부모님이 행복을 직접 추구하라고 나에게 결코 말하지 않은 이유는 밀과 마찬가지로 행복에 대한 정책 외적인 접근 방식을 믿기 때문입니다. 누군가가 당신에게 “당신을 행복하게 만드는 것”을해야한다고 말하면 그들은 의사 결정에 대한 정책적 접근 방식을지지하고 같은 척도로 평가합니다. 그게 바로 부모님이 저에게 원하지 않는 것입니다. 부모님이 밀을 읽으면서 이것을 배우지는 않았지만, 행복에 관한이 입장에 대한 놀랄만 한 점은 다른 버전이나 다른 버전에서 공유되는 것인데, 사실상 모든 다른 철학자는이 문제에 무게를 두었습니다.

이 계정 중 내가 가장 좋아하는 계정은 버트 랜드 러셀 (Bertrand Russell)입니다. 그는 어느 정도 Mill의 것과 똑같은 것을 말하지만, Mill의 엄숙한 무게와는 달리 무의미한 태도를 가지고 있습니다. Russell은 The Conquest of Happiness 에서 다음과 같이 썼습니다. “근본적인 행복은 사람과 사물에 우호적 인 관심을 불러 일으킬 수있는 것에 달려 있습니다.”그는 계속해서 “가능한 한 당신의 이익을 넓히고 사물에 대한 반응을 보이십시오. 관심있는 사람은 적대적 이라기보다 가능한 한 친근감을 느껴야합니다. ”

다시 말해서, 행복이란, 우호적 인 관심을 가질 가치가있는 많은 사람들과 사물들이 있고, 오직 그들 중 하나만이 자신의 것이라는 관찰의 당연한 결과입니다. 이 블로그를 쓰고 싶다는 생각을하는 것이 좋습니다.

참고 문헌

Mill, JS (1873/2003). 자서전. Project Guternberg.

Russell, B. (1930). 행복의 정복. 뉴욕, 뉴욕 : Liveright Publishing Corp.

  • 스트레스 사고 방식을 테스트하는 8 가지 방법
  • 가장 중요한 행복 결정 요소
  • 행복 추구 추구에서 벗어나기
  • Atsuko Hirayanagi와 "오 루시!"
  • 슬픔은 건강합니까?
  • 종교, 세속주의, 외국인 혐오증
  • 귀하의 자녀는 높은 성취율입니까?
  • 어떤 사람들은 자신을 행복하게 해주지 않는 5 가지 이유
  • 매일 추수 감사절을 축하해야하는 이유
  • 우리의 핵심 가치에서 살아 가기
  • 요르단 피터슨 : 안티 스토아
  • 대학의 소셜 미디어
  • 너의 각자에게 Fatalism과 무관심
  • 기분 조절 : 문자 메시지가 웰빙에 미치는 영향
  • 사랑의 환상이 당신이 가질 수있는 전부라면?
  • 너 졸업했을 지 몰라도 시험은 계속 나올거야.
  • 미국의 강박 관념은 쉽게 우리를 몰아 낼 수 있습니까?
  • 행복 : 국제적인 기쁨의 날을 향한 14 가지 아이디어
  • 길 잃은 사랑 재발견
  • Angelman 증후군을 가진 아이들은 정말로 행복합니까?
  • 모든 청소년들이 듣어야 할 5 가지 충고
  • 세상은 정말로 나쁜 것인가?
  • 세계를 변화시키는 동물 애호가의 가이드
  • 먹는 장애 복구 : 섹스와 친밀감에 대한 연결
  • 죽음 청소 : Döstädning의 예술 수용
  • "우리의 삶의 행진"- "건강한 분노"의 선구자 적 표현
  • 행복한 삶을 살아가는 데 필요한 10 가지 기술
  • 피해자와 같은 느낌을 멈출 준비가 되셨습니까?
  • 친절의 비밀의 샘 : 연결
  • IKEA 괴롭힘 실험, 사기 및 취약성 촉진
  • 스포츠 팬을 유도하는 두 가지 감정
  • 지능이란 무엇인가?
  • 올 가을에 번성하는 법
  • 첨부 : 인간 관계의 기초
  • 동물과 우리의 해 검토
  • 빌리지에 오신 것을 환영합니다.