Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Elk
- Heap
- r
- libuv
- Linux
- github
- network
- AWS
- Static
- VCS
- nodejs
- ajax
- Lombok
- NoSQL
- 네트워크
- effective
- redis
- cache
- mongodb
- HTTP
- javascript
- Java
- spring
- 데이터통신
- socket
- git
- html
- reactor
- mybatis
- reactive
Archives
- Today
- Total
빨간색코딩
logstash grok pattern 본문
grok은 비정형 데이터를 파싱하여 정형데이터로 만드는 라이브러리다. key/value형태로 적재된다. 골때리는건 정규표현식쓰는 방법이 독특하다는 거다..
참조문서 : https://www.elastic.co/guide/en/logstash/current/plugins-filters-grok.html
1. 기본문법
%{SYNTAX:SEMANTIC}
SYNTAX = 텍스트와 일치하는 패턴의 이름
SEMANTIC = 식별자
(ex)
%{NUMBER:duration} %{IP:client} (필터링) SEMANTIC SYNTAX 식별자 텍스트 (결과) 버전 3.44 클라이언트 1.1.1.1
2. 기존 패턴 라이브러리
https://github.com/elastic/logstash/blob/v1.4.0/patterns/grok-patterns
3. 사용자 정의 패턴
3-1. 정의
logstash-5.4.0/patterns에 파일을 하나 만들고 여기서 기존 grok-pattern들 처럼 사용자가 정의해주고 임포트해주면 된다. (디렉터리명과 파일명은 아무 상관이 없다)
ex.
POSTFIX_QUEUEID [0-9A-F]{10,11}
3-2. 사용자패턴 만든거 사용할 때
grok {
patterns_dir => ["./patterns"]
}
테스트
log : 127.0.0.1 - - [29/May/2017:05:08:09 +0900] "GET /index HTTP/1.1" 200 1272
패턴 : ^%{IPORHOST:clientip} (?:-|%{USER:ident}) (?:-|%{USER:auth}) [%{HTTPDATE:timestamp}] "(?:%{WORD:verb} %{NOTSPACE:request}(?: HTTP/%{NUMBER:httpversion})?|-)" %{NUMBER:response} (?:-|%{NUMBER:bytes})
코드
input { stdin { } } filter { grok { patterns_dir => ["./patterns"] match => { "message" => "%{TEST}" } } } output { stdout { codec => rubydebug { } } }
결과
4. 웹 디버거
'빅데이터' 카테고리의 다른 글
logstash 5.4 설치 (0) | 2017.05.29 |
---|---|
엘라스틱서치(elasticsearch) 5.4 설치 (0) | 2017.05.29 |
하둡의 기본 개념 (HDFS, heartbeat, MapReduce, MapReduce job) (0) | 2017.03.23 |
클라우데라 하둡(Cloudera Hadoop) 1 (0) | 2017.01.11 |
Comments