기본 콘텐츠로 건너뛰기

Log4J Async 설정하기

  현재 진행 중인 검색 (Solr + SolrJ) 프로젝트에서 Paging 처리를 하고 있는데 페이지를 랜덤으로 이동을 하게 되면 시간이 너무 오래 걸리는 증상이 발견이 되어, 이런 저런 테스트와 Solr 관리 화면을 통해서 start 와 rows 를 지정하고 검증을 해 보면 약간 느리다는 느낌을 받지만 그 다지 문제가 되지는 않을 정도로 결과가 나왔다. 그런데 막상 구현한 SolrJ 클라이언트를 통해서 검색을 하면 무려 11초 이상이 걸리는 증상이 계속되고 있다.
 
  여러 가지 의심되는 부분들을 조정하면서 검증을 수행한 결과 Log4J 의 Logging 처리 때문이라는 것이 확인이 되었다. 이유는 기본 Log4J 에 LogLevel을 Debug로 설정 상태에서 Solr 의 결과를 Debug 출력하고 있었던 것이 문제가 된 것이다. 로그 출력을 INFO 수준으로 높이고 실행한 결과 대략 Solr 관리 화면에서 수행한 것과 비슷한 수행 시간이 걸리는 것을 확인했다.
 
  검증을 위해서 결과 출력을 제외할 수는 없기 때문에 비 동기 방식으로 전환을 하여 적용하면 약간은 느리겠지만 정보를 확인하는데 문제는 없기 때문에 이번에는 비 동기 설정에 대해서 정리를 하도록 한다.
 
Log4J Async 설정
 
  Log4J 에서는 AsyncAppender를 제공하고 있으며 이를 통해서 로그를 비 동기로 처리하게 된다. 설정 방법은 기존에 사용하는 것과 크게 다르지 않다. 다만 CONSOLE 이나 FILE 등의 Appender 를 사용하고 있었다면 AsyncAppender로 기존 Appender를 연결해서 사용하도록 해 주면 된다. 아래의 예제를 확인해 보자.
 




threshold="debug">
name="CONSOLE"
class="org.apache.log4j.ConsoleAppender">
name="Target"
value="System.out" />
name="ConversionPattern"
value="%d{ABSOLUTE} (%-5p) [%t] [%c{1}] %m%n" />
 
name="FILE"
class="org.apache.log4j.DailyRollingFileAppender">
name="File"
value="C:\\temp\\logs\\search.log" />
name="Append"
value="true" />
name="DatePattern"
value="'.'yyyy-MM-dd" />
name="ConversionPattern"
value="%d{ABSOLUTE} [%-5p] [%t] [%c{1}] %m%n" />
 
name="ASYNC_CONSOLE"
class="org.apache.log4j.AsyncAppender">
name="BufferSize"
value="8192" />
 
name="ASYNC_FILE"
class="org.apache.log4j.AsyncAppender">
name="BufferSize"
value="8192" />
 
 
  위의 요소에서 보이는 것과 같이 ASYNC_FILE Appender를 사용하고, ASYNC_APPENDER 는 내부에 FILE APPENDER를 참조해서 동작하게 된다. 비 동기 처리할 때의 기준은 위에서 "ASYNC_FILE" 이나 "ASYNC_CONSOLE" 설정과 같이 BufferSize 를 설정해 주면 된다. 해당 값에 따라서 메모리 상에 출력할 로그 정보를 관리하다가 Buffer가 모자라게 되면 지정된 FILE Appender에 출력을 진행하게 된다.
 
Log4J2 (v2.0) Async 설정
 
  참고로 현재는 대부분 slf4j 와 logback 등을 사용하는 것으로 보이지만 log4j 도 2.0 버전으로 log4j2 라는 이름으로 계속 진행되고 있다. Log4j2 에서는 Async Appender를 별도로 Configuration 설정에 추가하지 않고도 전체 Logger를 비동기 처리할 수 있도록 "-DLog4jContextSelector=org.apache.logging.log4j.core.async.AsyncLoggerContextSelector" 옵션을 설정해서 사용하면 된다. 물론 Sync 와 Async 모두 사용하도록 설정할 수도 있다. Log4j2 에 대한 Sync, Async, All Async 에 대한 참고와 성능 비교는 여기에서 확인할 수 있다.
 
  그리고 Log4J2 Async 는 내부적으로 Disruptor를 사용하고 있으므로 아래와 같이 Maven 설정을 해 주어야 한다.
 
Log4J2 Maven
 


    org.apache.logging.log4j
    log4j-core
    2.1
    

    com.lmax
    disruptor
    3.0.1

...
 
All Async 를 사용하는 경우 설정







    
        
        
            
                %d %p %c{1.} [%t] %m %ex%n
            
        
    
    
        
            
        
    
 
Async 와 Sync 를 섞어서 사용하는 경우 설정







    
        
        
immediateFlush="false" append="false">
            
                %d %p %class{1.} [%t] %location %m %ex%n
            
        

    
    
        
        
            
        
        
            
        
    
 
Async 처리할 때 주의할 점
 
  우선 비 동기 처리를 할 때의 한 가지 주의할 점은 로그를 출력을 요청하는 시점과 실제 로그 매체로 정보를 쓰는 시점이 다르다는 것 때문에 발생하는 데이터의 불변성 문제를 이해하는 것이다. 예를 들어 어떤 객체를 로그 처리하는데 그 시점의 객체가 100 이라는 값을 가지고 있었지만, 실제 매체에 출력될 때 객체의 값이 200으로 변경이 되었거나 아니면 객체가 제거된 상태라면 로그 출력은 정확하지 않은 정보를 출력하거나 출력하지 못하는 null 참조 오류가 발생하게 된다. (물론 비 동기 오류이기 때문에 발생했는지도 모르겠지만, 원하는 로그 정보가 존재하지 않게 된다)
 
  아래와 같이 단적인 사례를 확인해 볼 수 있다.


public class AsyncLog4jTest {
    private static final AtomicLong value = new AtomicLong();
 
    @Override
    public String toString() {
        return Long.toString(value.get());
    }
 
    public long next() {
        return value.incrementAndGet();
    }
 
    public static void main(String[] args) {
        for (int i = 0; i < 32; i++) {
            new Thread() {
                final Logger logger = LogManager.getLogger(AsyncLog4jTest.class);
                final AsyncLog4jTest ins = new AsyncLog4jTest();
 
                @Override
                public void run() {
                    for (int i = 0; i < 100; i++) {
                            logger.warn("increment: {} == current: {}", ins.next(), ins); // 객체 사용
                            // logger.warn("increment: {} == current: {}", ins.next(), ins.toString()); // 불변의 문자열 사용
                    }
                }
            }.start();
        }
    }
}
 
  위의 예제는 32개의 쓰레드를 생성해서 각각 100번씩 루프를 돌면서 인스턴스의 Long 값을 로그로 남기는 예제다. 여기서 중요한 부분은 로그를 Async 로 설정 (위에서 설명한 Async 옵션을 log4j2 에 적용) 한 상태에서 객체를 로그로 보내는 경우와 문자열을 객체로 보내는 경우를 비교한 것이다. 위의 코드를 객체와 문자열로 처리한 결과는 다음과 같다.
 
>>> 객체를 사용한 경우 (서로 다른 값 발생)
 
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-10] increment: 10 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-2] increment: 2 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-4] increment: 4 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-8] increment: 8 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-0] increment: 1 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-6] increment: 6 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-3] increment: 3 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-9] increment: 9 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-5] increment: 5 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-7] increment: 7 == current: 10
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-9] increment: 11 == current: 14
2014-11-29 15:38:00,351 WARN c.m.s.l.AsyncLog4jTest [Thread-10] increment: 13 == current: 14
 
>>> 문자열을 사용한 경우 (모든 값 일치)
 
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-9] increment: 9 == current: 9
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-2] increment: 2 == current: 2
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-3] increment: 3 == current: 3
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-5] increment: 5 == current: 5
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-10] increment: 10 == current: 10
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-4] increment: 4 == current: 4
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-7] increment: 7 == current: 7
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-9] increment: 11 == current: 11
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-6] increment: 6 == current: 6
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-0] increment: 1 == current: 2
2014-11-29 15:32:39,767 WARN c.m.s.l.AsyncLog4jTest [Thread-3] increment: 12 == current: 12
 
  위의 결과에서 볼 수 있듯이 next() 의 결과는 Long 이기 때문에 불변 값에 속해서 출력이 되었지만 ins 객체를 사용한 경우는 출력이 되는 시점에 객체의 값을 출력하기 때문에 항상 next 처리된 값보다 큰 상태가 된다.
 
  실제 운영 중인 시스템에서 문제가 발생한 것과 문제 원인을 파악하는데 로그를 사용할 수 밖에는 없다. 따라서 위와 같은 상황이 되면 로그 자체가 정확한 상태를 반영하지 못하는 것이 될 수 밖에는 없기 때문에 비 동기 출력을 사용하는 경우에는 로그에 출력된 값이 정확한 상태를 나타낼 수 있도록 불변의 값을 사용해야 한다는 점을 이해하고 사용해야 한다.

댓글

이 블로그의 인기 게시물

OData 에 대해서 알아보자.

얼마 전에 어떤 회사에 인터뷰를 하러 간 적이 있었다. 당시 그 회사는 자체 솔루션을 개발할 기술인력을 찾고 있었고 내부적으로 OData를 사용한다고 했다. 좀 창피한 이야기일 수도 있지만 나름 기술적인 부분에서는 많은 정보를 가지고 있다고 했던 것이 무색하게 OData란 단어를 그 회사 사장님에게서 처음 들었다. 작고, 단순한 사이트들만을 계속해서 작업을 하다 보니 어느덧 큰 줄기들을 잃어버린 것을 느끼기 시작했다. 명색이 개발이 좋고, 기술적인 기반을 만들려고 하는 인간이 단어조차도 모른다는 것은 있을 수 없는 것이라서 다시 새로운 단어들과 개념들을 알아보는 시간을 가지려고 한다. OData (Open Data Protocol) 란? 간단히 정리하면 웹 상에서 손쉽게 데이터를 조회하거나 수정할 수 있도록 주고 받는 웹(프로토콜)을 말한다. 서비스 제공자 입장에서는 웹으로 데이터를 제공하는 방식으로 각 포탈 사이트들이 제공하는 OPEN API 포맷을 독자적인 형식이 아니라 오픈된 공통규약으로 제공 가능하며, 개발자는 이 정보를 다양한 언어의 클라이언트 라이브러리로 어플리케이션에서 소비할 수 있도록 사용하면 된다. 공식 사이트는 www.odata.org 이며 많은 언어들을 지원하고 있다. 좀더 상세하게 정의를 해 보면 OData는 Atom Publishing Protocol  (RFC4287) 의 확장 형식이고 REST (REpresentational State Transfer) Protocol 이다. 따라서 웹 브라우저에서 OData 서비스로 노출된 데이터를 볼 수 있다. 그리고 AtomPub 의 확장이라고 했듯이 데이터의 조회만으로 한정되는 것이 아니라 CRUD 작업이 모두 가능하다. Example 웹 브라우저에서 http://services.odata.org/website/odata.svc 를 열어 보도록 하자. This XML file does not appear to have any style in...

C# 에서 Timer 사용할 때 주의할 점.

예전에 알고 지내시던 분의 질문을 받았다. Windows Forms 개발을 하는데, 주기적 (대략 1분)으로 데이터 요청을 하는 프로그램을 작성하기 위해서 Timer 를 사용하는데, 어떤 기능을 처리해야 하기 때문에 Sleep 을 같이 사용했다고 한다. 여기서 발생하는 문제는 Sleep 5초를 주었더니, Timer 까지 5초 동안 멈춘다는 것이다. Timer 라는 것은 기본적으로 시간의 흐름을 측정하는 기능이기 때문에 Sleep 을 했다고 해서 Timer 가 멈추는 일은 생겨서는 안된다. 그러나 실제 샘플을 만들어 보면 ... Timer 가 Sleep 만큼 동작이 멈추는 것을 확인할 수 있다. Windows Forms 는 UI Thread 를 사용하는 것으로 최적화 되어 있으며 여기서 Timer 를 쓰면 UI Thread 에 최적화된 System.Windows.Forms.Timer 가 사용된다. 여기서 문제의 발생이 시작되는 것이다. Sleep 을 사용하게 되면 UI Thread 가 Sleep 이 걸리기 때문에 여기에 속한 Timer 까지도 멈추는 것이다. 이런 문제를 해결하기 위해서는 System.Threading.Timer 를 사용해야 한다. 이 Timer 는 별도의 Thread 에서 동작하기 때문에 Sleep 의 영향을 받지 않는다. 언뜻 보면 쉬운 해결 방법인 것 같지만 Thread 가 분리되었기 때문에 Timer 가 돌아가는 Thread 에서 UI Thread 의 메서드나 컨트롤에 접근하기 위해서는 별도의 명령을 사용해야 하는 문제가 존재한다. 자~ 그럼 여기서 Timer 에 대해서 다시 한번 정리해 보도록 하자. .NET 에서 제공하는 Timer 들 .NET 에서는 기본적으로 3가지 Timer를 제공하고 있다. (MSDN) System.Windows.Forms.Timer - 사용자가 지정한 간격마다 이벤트를 발생시키며 Windows Forms 응용 프로그램에서 사용할 수 있도록 최적화 되어 있다. System...

[Logging] NLog 사용법 정리...

SCSF 에는 기본적으로 Enterprise Library가 사용된다. 예전에도 그랬지만 기능은 훌륭하고 많은 부분에서 최적화(?)된 것일지도 모르지만, 역시나 사용하기에는 뭔가 모르게 무겁고, 사용하지 않는 기능이 더 많다라는 느낌을 지울수가 없다. 이번 프로젝트도 SCSF를 기반으로 하고 있지만, Enterprise Library를 걷어내고 각 부분에 전문화된 오픈 소스를 사용하기로 하였다. 예전에는 Log4Net을 사용했지만, 대량 사용자 환경에서는 메모리 누수와 기타 문제점이 존재한다는 MS 컨설턴트(?)의 전해진 말을 들은 후로는 사용하지 않는다. 대안으로 사용하는 것이 NLog 이다. 조금 후에는 3.0 버전도 나온다고 홈 페이지에 기재되어 있지만, 그 때가 되면 프로젝트는 끝나기 때문에 현재 2.1.0 버전을 사용하기로 했다. [원본 출처] http://cloverink.net/most-useful-nlog-configurations-closed/ 위의 참조 자료에는 다양한 정보들이 존재하므로 꼭 링크를 통해서 관련된 정보를 확인하고 이해하는 것이 좋을 듯 하다. 여기서는 당장 필요한 부분만을 정리하도록 한다. [ Logger 찾기 ] 기본적으로 Logger가 존재하는 클래스를 기반으로 Logger 정보를 구성한다. Logger logger = LogManager.GetCurrentClassLogger(); 주로 Namespace 기반으로 Logger를 설정하는 경우에 유연하게 사용할 수 있다. 또 다른 방법으로는 지정한 문자열로 특정 Logger를 직접 선택하는 방법도 제공된다. 이를 혼용해서 Namespace와 직접 지정 방식을 같이 사용할 수도 있다. 물론 Logger 환경 설정에서 Wildcard (*)를 지정할 수도 있다. Logger logger = LogManager.GetLogger("Database.Connect"); Logger logger = LogManager.Get...