'전체 글'에 해당되는 글 152건

2017.05.01 촘스키의 머신러닝 비판에 대하여
2017.05.01 MultiLyaer Perceprton Decision Boundaries - XOR/은닉층
2010.10.08 신성한 것의 복귀인가 2
2010.10.08 결합 인덱스 (Composite Index) - 오라클
2010.09.27 클라우드컴퓨팅 - 사례, SK 텔레콤

촘스키의 머신러닝 비판에 대하여

software 2017. 5. 1. 07:49

좀 지난 이야기긴 한데, 촘스키 선생께서 기계학습이 성과에 대해 일갈하셨다고 한다.

그간 많은 변화가 있었으니, 최근에는 촘스키 선생의 견해도 달라졌으지도 모르겠다.

http://www.tor.com/2011/06/21/norvig-vs-chomsky-and-the-fight-for-the-future-of-ai/

이에 대한 peter norvig 의 반응

On Chomsky and the Two Cultures of Statistical Learning

뉴튼도 중력에 의한 운동법칙은 (거의)완성했지만 중력의 원인은 알지 못했고, 상대성이론도 시간이 무엇인지는 설명하지 않는다.

어쨋든, 이런 촘스키식의 비판은 오히려 반갑다.

지능에 대한 현재 딥러닝의 접근법에 분명 한계는 존재하며 섣부른 환원주의야 말로 위험한 것이라 생각하기 때문이다.

아무튼, 아름답지 않은가.

케라스와 함께하는 쉬운 딥러닝 (18) - 순환형 신경망(RNN) 모델 만들기 1 · Buomsoo Kim

<이미지 출처: https://colah.github.io/posts/2015-08-Understanding-LSTMs/>

Posted by ukmie

MultiLyaer Perceprton Decision Boundaries - XOR/은닉층

software 2017. 5. 1. 07:06

예전에 패턴인식책에서 봤던 이 그림. 제대로 알아보자

http://slideplayer.com/slide/8218292/

* Each neuron in the first hidden layer forms a hyperplane in the input pattern space.

* A neuron in the second hidden layer can form a hyper-region from

the outputs of the first layer neurons by performing an AND

operation on the hyperplanes. These neurons can thus approximate

the boundaries between pattern classes.

* The output layer neurons can then combine disjoint pattern classes

into decision regions made by the neurons in the second hidden

layer by performing logical OR operations.

(https://books.google.co.kr/books?isbn=0070482926)

아래 그림도 참고

http://t-robotics.blogspot.kr/2015/05/deep-learning.html#.WQZapNLyjAM

http://www.iro.umontreal.ca/~vincentp/

추가로,

No more than three layers in binary threshold feedforward networks are required to form arbitrarily complex decision regions.

Proof: By Construction

* Consider the n–dimensional case: X ∈ R n .

* Partition the desired decision regions into small hypercubes.

* Each hypercube requires 2n neurons in the first layer

(one for each side of the hypercube).

* One neuron in the second layer takes the logical AND of the

outputs from the first layer neurons. Outputs of second

layer neurons will be high only for points within the hypercube.

* Hypercubes are assigned to the proper decision regions by

connecting the outputs of second layer neurons to third

layer neurons corresponding to the decision region that the

hypercubes represent by taking the logical OR of

appropriate second layer outputs.

(https://books.google.co.kr/books?isbn=0070482926)

그럼, 히든 레이어와 노드수는 어떻게 결정할까

http://images.slideplayer.com/32/9894611/slides/slide_63.jpg

=> details

How to choose the number of hidden layers and nodes in a feedforward neural network?

Posted by ukmie

신성한 것의 복귀인가

왁자지껄 2010. 10. 8. 12:54

미국인의 55%가 해악으로부터 자신을 보호해주는 수호천사의 존재를 믿는다고 한다.
[관련기사]

문득, 소시적에 읽었던 다니엘 벨 형님의 강연문이 생각나 찾아봤다.
원문은 찾을 수 없었으나 한국정보사회학회 학술대회 자료에서 그럴듯한 텍스트를 발견했다.
오 놀라운 구글신님의 은혜로다~

‘후기산업사회론’을 주창하며 정보사회론을 주도한 벨은 1977년 런던대학 경제학부에서행한 홉하우스 기념강연에서 “신성한 것의 복귀인가?: 종교의 미래에 관한 논거”(THE RETURN OF THE SACRED? The Argument on the Future of Religion)라는 강연을통해 종교의 미래에 대해 언급하고 있다(Bell, 1980).

이 강연에서 벨은 정보화와의 연관성 속에서 종교의 변화를 논의하고 있지는 않다. 그러나 벨은 강연을 통해서 19-20세기를 주도한 계몽주의가 종교의 기원을 원시적이며 물신적인 것으로 간주하여 이성의 빛에의해 혹은 과학에 의해 종교가 사라지게 될 것으로 보는 것은 잘못된 것이고, 종교의 바탕은 인간의 유한성에 대한 자각이요 인간 능력의 냉혹한 한계성에 대한 인식이며 이런 한계를 자연에 조화시킬 수 있는 일관성 있는 답을 얻기 위한 부단한 노력이라고 주장한다. 즉 종교를 인간 경험을 구성하는 한 측면으로서 제시한 것이다.
그리고 철저한 자아가 판단의 기준이 되는 시대의 종교로, 즉 미래의 종교로 ‘도덕화’의 종교, 속죄적 종교,신화적 종교 등의 등장을 주장한다. 이와 함께 종교의 제도적 틀이 무너지기 시작하면 인간은 ‘종교적’ 성질을 느낄 수 있는 직접적인 경험을 찾게 된다고 주장하였다.

벨의 이와 같은 논의는 모더니즘과 인간 이성을 강조한 계몽주의에 대한 비판적 검토로부터 시작하고 있어, 정보화 논의와 직접적인 연관성을 갖지는 않는다.
그러나 종교의 제도적 틀이 무너지면 인간이 종교적 성질을 느낄 수 있는 직접적인 경험을 추구하게 된다는 주장이나 속죄적 종교가 오늘날 인터넷 상에서 다양하게 관찰되는 자발적 종교 커뮤니티 활동을 설명하는데 유용하게 이용될 수 있다는 점, ‘도덕화’의 종교나 신화적 종교의 등장 예측이 근본주의와 신비주의 종교들이 강화되고 있는 현대의 종교 양상을 매우적절히 설명할 수 있다는 점 등에서 벨의 논의가 갖는 시사점은 매우 크다고 할 수 있다.

[정보사회의 새로운 도전과 응전 - 인터넷 상의 종교 활동 실태와 의미]
http://www.infoso.org/pds/01/kais_proceeding_변환.pdf

Posted by ukmie

결합 인덱스 (Composite Index) - 오라클

software 2010. 10. 8. 08:55

출처 : http://www.gurubee.net/pages/viewpage.action?pageId=2458051

1. 결합인덱스의 장점

좋은 분포도 : 나쁜 분포도를 가진 column을 결합한 결합 인덱스가 더 좋은 분포도를 가질 수 있다.
저장 공간의 효율성 : 한 질의에 의해 선택된 모든 칼럼이 결합인덱스에 있을 경우, table을 access하지 않고 결합 인덱스 만으로 원하는 값을 가져올 수 있다. 그러나 그만큼의 디스크나 메모리에 부하가 많이 걸릴 것이다.

[예] select empno from emp where empno='123';

이 경우는 특별히 테이블을 access하지 않고 index만으로 해당값을 출력할수 있다. 따라서 검색속도가 비약적으로 빨라지는 효과를 볼 수 있습니다.

2. 결합 인덱스의 column선택을 위한 지침

각 column의 분포도 보다 결합 인덱스에서 결합된 분포도가 더 좋을 경우
여러 질의에서 하나이상의 칼럼값을 가진 칼럼의 동일한 집합을 질의할 경우, 이들 모든 칼럼을 포함하는 결합 인덱스 생성을 고려한다.

3. 결합 인덱스 구성시 column순서 배치를 위한 지침

WHERE절에 사용된 칼럼을 선행부분으로 만들기 위한 결합 인덱스를 생성
칼럼의 일부가 WHERE절에서 자주 사용될 경우 =>자주 select되는 column을 선행부분올 만들어서 이 column만으로 인덱스를 사용할 수 있도록 한다.
모든 칼럼이 WHERE절에서 동일하게 사용되면 =>질의 성능을 개선하기 위하여 CREATE INDEX statement에서 분포도가 좋은 순서대로 배열
모든 칼럼이 WHERE절에서 동일하게 자주 사용되지만 데이터가 한 column에 대해 물리적으로 정렬되어 있으면 =>그 column을 결합 인덱스의 첫번째로 구성
‘=’을 사용할 땐 선택범위가 좁은 것을 앞에 놓는다.

4. in을 이용한 access효율 향상. (in은 ‘=’의 의미를 가지고 있다.)

예) select * from tab1 where col1='a' and col2 between '111' and '112';

→select * from tab1 where col1='a' and col2 in('111', '112');

여기서 col2의 값이 적을수록 후자의 속도가 빨라진다. 물론 보통의 경우에도 후자가 빠르다.

일반적으로 between, like문이 들어가는 SQL문은 in문으로 대체해 준다.

5. 일부컬럼만 사용할 경우

만약 index가 (a+b+c)로 이루어져 있을 경우 where조건에서 a, a+b, a+c, a+b+c가 나오면 index적용이 가능 하지만, b, b+c가 나오면 index적용이 불가능하다. -> B*Tree에서 검색이 불가능 하기 때문에.. 따라서 결합인덱스의 첫 번째 컬럼이 꼭 나와야 index를 적용할 수가 있다. 아울러 대개의 결합인덱스는 최고 5개까지가 적당함. 그럼 간략히 정리를 해보겠습니다.

**
IN을 고려한 결합 인덱스의 선정

인덱스의 선정

인덱스 선정절차

대용량 INDEX 처리에 관한 SQL