| detect_handledata(3) | Library Functions Manual | detect_handledata(3) |
detect_handledata, detect_handledata_r - 문자셋과 정확도를 측정
#include <chardet.h>
short detect_handledata (Detect ** handle, const char * inbuf, DetectObj ** outbuf);
short detect_handledata_r (Detect ** handle, const char * inbuf, size_t inlen, DetectObj ** outbuf);
inbuf 의 문자셋과 정확도를 outbuf에 저장한다.
detect_handledata API는 binary safe 문제로 더이상 사용을 권장하지 않습니다. detect_handledata_r API를 이용하십시오.
inlen
문자셋과 정확도를
측정할 입력
문자열의 길이
typedef struct DetectObject {
char * encoding;
float confidence;
} DetectObj;
outbuf는 detect_obj_init api를 이용하여 초기화를 한 후에 detect api로 넘겨줘야 한다.
경우에 따라 아래의 상태를 반환한다.
#include <chardet.h>
int main (void) {
Detect * d;
DetectObj * obj;
int i, arrayNum;
char *str[] = {
"this is ascii",
"이건 euc-kr 입니다."
};
arrayNum = sizeof (str) / sizeof (str[0]);
if ( (d = detect_init ()) == NULL ) {
fprintf (stderr, "chardet handle initialize failed\n");
return CHARDET_MEM_ALLOCATED_FAIL;
}
for ( i=0; i<arrayNum; i++ ) {
detect_reset (&d);
if ( (obj = detect_obj_init ()) == NULL ) {
fprintf (stderr, "Memory Allocation failed\n");
return CHARDET_MEM_ALLOCATED_FAIL;
}
//switch (detect_handledata (&d, str[i], &obj))
switch (detect_handledata_r (&d, str[i], strlen (str[i]), &obj))
{
case CHARDET_OUT_OF_MEMORY :
fprintf (stderr, "On handle processing, occured out of memory\n");
detect_obj_free (&obj);
return CHARDET_OUT_OF_MEMORY;
case CHARDET_NULL_OBJECT :
fprintf (stderr,
"2st argument of chardet() is must memory allocation "
"with detect_obj_init API\n");
return CHARDET_NULL_OBJECT;
}
# obj-bom 은 CHARDET_BOM_CHECK 상수 지원여부로 지원을 판단할 수 있습니다.
printf ("encoding: %s, confidence: %f, exists bom: %d\n", obj->encoding, obj->confidence, obj->bom);
detect_obj_free (&obj);
}
detect_destroy (&d);
return 0;
}
김정균
https://github.com/Joungkyun/libchardet/issues
detect_obj_init(3), detect_obj_free(3), detect_init(3), detect_reset(3), detect_destroy(3)
| 2019-08-01 | libchardet manuals |