건강한 사람의 폐에서 나는 소리로, 공기가 기도와 폐포를 드나들며 나는 부드러운 바람 소리입니다. 청진하는 위치에 따라 아래와 같이 세부적으로 나뉩니다.
1) 기관지음 (Bronchial): 목 근처(굵은 기도)에서 들리는 거칠고 높은 톤의 소리
2) 폐포음 (Vesicular): 갈비뼈 근처(폐의 대부분 지역)에서 들리는 부드럽고 낮은 톤의 바스락거리는 소리
2. 질병이 있을 때 나는 이상 소리: 부잡음 (Adventitious Sounds)
폐나 기관지에 염증, 가래, 수분 등이 차서 비정상적으로 발생하는 소리입니다.
오디오 신호 분석(사운드 분류) 연구에서 매우 중요하게 다뤄지는 소리들입니다.
수포음 (Cracles / Rales):
어떤 소리? 머리카락을 귀 옆에서 비빌 때 나는 바스락거리는 소리, 또는 탄산음료 기포가 터지는 소리입니다.
원인: 폐포에 물이나 염증성 액체가 차 있다가 숨을 들이쉴 때 찌개지듯 열리면서 납니다. (예: 폐렴, 폐수종)
천명음 (Wheezing):
어떤 소리? 숨을 내쉴 때 쌕쌕거리거나 삐이- 하는 높은 톤의 휘파람 같은 소리입니다.
원인: 기관지가 심하게 좁아져서 공기가 간신히 빠져나갈 때 발생합니다. (예: 천식, COPD)
협착음 (Stridor):
어떤 소리? 컹컹거리거나 꺼억꺼억하는 매우 거칠고 높은 고음의 소리입니다.
원인: 기도 상부가 이물질이나 급성 염증으로 막혀 숨길이 위험할 정도로 좁아졌을 때 청진기 없이도 들립니다.
수양음 / 단염음 (Rhonchi):
어떤 소리? 코를 고는 듯한 낮고 거친 드르렁 소리입니다.
원인: 큰 기관지에 가래(점액)가 걸려 있어서 공기가 지나갈 때 가래가 떨리는 소리입니다. 기침을 하고 나면 일시적으로 사라지기도 합니다.
장음(Bowel Sounds)
장음(Bowel Sounds)은
음식물, 소화액,
그리고 가스가 장의 연동운동(Peristalsis)에 의해 소장과 대장을 통과할 때 발생하는
모든 소리
의학적 청진뿐만 아니라
최근 인공지능(AI) 기반의 바이오 사운드(Bio-sound) 분석 분야에서도
핵심적인 지표로 연구되고 있습니다.
1. 장음이 발생하는 원리
위장관의 평활근이 주기적으로 수축하고 이완하면서 내부의 내용물들을 아래로 밀어냅니다.
이때 장벽이 움직이고, 내부의 '액체(소화액)'와 '기체(가스)'가 좁은 통로를 지나며 섞이고 부딪힐 때 소리가 나게 됩니다
2. 장음의 상태별 분류 (의학적 판단 기준)
의사들이 청진기로 배를 들었을 때, 장음의 빈도와 형태에 따라 크게 4가지로 분류.
1) 정상 장음 (Normal):
보통 5~15초마다 한 번씩 불규칙하게 "구르륵", "보글보글" 하는 부드러운 소리(분당 약 5~30회)
2) 과활동성 장음 (Hyperactive):
소리가 매우 크고, 높은 톤(Metal-like)의 핑핑 튀는 소리가 빈번하게 납니다. 장이 과도하게 움직이고 있다는 뜻.
설사, 대장염, 장폐색 초기(막힌 곳을 뚫으려고 장이 격렬하게 움직임),
식후 세균 과증식(SIBO)으로 인한 급격한 가스 발효 시기.
3) 저활동성 장음 (Hypoactive):
장음의 횟수가 분당 1~2회 이하로 급격히 줄어들고 소리도 매우 작고 힘이 없습니다. 장의 움직임이 둔해진 상태.
변비, 메탄 우세형 SIBO, 전신 마취 후 회복기, 수면 상태.
4) 장음 소실 (Absent):
배에 청진기를 대고 2~5분 동안 집중해서 들어도 아무런 소리가 나지 않는 상태입니다. 이는 의학적 응급 상황일 수 있습니다.
장마비(Paralytic ileus), 장천공, 복막염 (장이 운동을 아예 멈춘 상태).
3. 공복 시 장음: 장을 청소하는 소리 (MMC)
식사 후 소화가 끝난 공복 상태(약 90~120분 뒤)가 되면,
배에서 청진기 없이도 들릴 만큼 큰 "꼬르륵" 소리(장명, Borborygmi)가 납니다.
이는 배가 고프다는 신호이기도 하지만,
생리학적으로는 이동성 위장관 소화운동(MMC)의 Phase III 단계에서
소장 내 잔여물과 세균을 대장으로 쓸어내기 위해 발생하는 '정상적인 청소부 소리'입니다.
1. 전체 개념
이 이미지는
공복 상태(음식물이 없는 상태)에서 소화관이 주기적으로 일으키는 강력한 운동 패턴인
이동성 운동 복합체(Migrating Motor Complex, MMC)를 설명.
MMC는
흔히 “장 청소부(sweeper)” 또는 “housekeeper wave”라고 불리며,
공복기에 장 내 잔여물, 세균, 점액 등을 대장 쪽으로 쓸어내는 중요한 역할.
2. MMC의 기본 정보
발생 부위: 근위 위(Proximal stomach)에서 시작
주기: 약 60~90분마다 한 번씩 발생 (개인차 있음)
전파 방향: 위 → 십이지장 → 공장 → 회장(말단 회장)까지 천천히 이동 (distal propagation)
총 소요 시간: 위에서 시작해 회장까지 도달하는 데 수 시간이 걸림 (이미지에서는 0~6시간 축으로 표현)
3. MMC의 3가지 Phase (단계)
Phase 이름 특징 생리적 의미
Phase 1
Quiescent (휴지기)
거의 수축이 없음 (Physiological ileus)
장이 가장 조용한 상태
Phase 2
Increasing activity
수축 빈도와 강도가 점차 증가
활동이 서서히 시작
Phase 3
Peak activity (최고 활동기)
가장 강력한 전기적·기계적 수축
MMC의 핵심 — 강한 수축파가 distal로 전파됨
Phase 3가
바로 “강력한 수축파(Strong waves of contractions)”이며,
이 단계에서 장음이 가장 뚜렷하게 발생합니다.
4. 도표 해석 (하단 그래프)
X축: 시간 (0~6시간)
Y축: 위(Antrum) → 회장(Ileum)까지의 해부학적 위치
파란 실선/점선: Activity front (활동 전선) = Phase 3의 강력한 수축파가 시간이 지남에 따라 distal direction으로 이동하는 것을 보여줌
각 Phase 3 파가 위에서 시작해 회장까지 내려가는 패턴을 명확히 시각화
5. 생리적·임상적 의의
“Sweeper” 역할 Phase 3의 강력한 수축은 장 내 청소 기능을 수행합니다:
음식물 찌꺼기 제거
세균 과증식(SIBO) 예방
장 운동 리듬 유지
IBS와의 관련성 (이전 대화 연장)
IBS 환자에서는 MMC의 Phase 3 빈도 감소 또는 불규칙한 패턴이 자주 관찰됩니다.
이로 인해 장음의 진폭(amplitude), 버스트(burst) 패턴, 음성분 간격(component interval time)이 정상과 다르게 나타나며, Du et al. (2019) 연구에서 이 특징들이 IBS 진단 모델에서 가장 중요한 변수로 선정된 이유입니다.
4. AI 신호 처리 관점에서의 장음 (Bowel Sounds)
오디오 신호 분석 및 딥러닝 연구에서 장음은
매우 다루기 까다로운 신호로 분류됩니다.
1) 간헐적 버스트(Burst) 신호:
장시간 녹음 중에서 장음은 연속적이지 않고, 수 밀리초(ms)에서 수 초 동안만 잠깐 팍 터져 나왔다 사라집니다.
2) 심한 클래스 불균형:
전체 녹음 시간 중 '정적'이나 '주변 소음(옷 스치는 소리, 숨소리)'이 95% 이상을 차지하고,
실제 유의미한 '장음'은 아주 적은 비율만 차지하므로 AI가 이를 정확히 탐지하기(Detection) 어렵습니다.
3) 낮은 신호 대 잡음비(SNR):
심장 박동 소리, 폐의 호흡음, 외부 환경 소음 등이 장음과 섞이기 때문에
정밀한 주파수 필터링과 시간적 연속성을 분석하는 알고리즘(시간적 스무딩 등)이 필수적입니다.
심장소리(heart sound)
심음(Heart Sounds)은
심장이 수축하고 이완할 때, 심장 내부의 판막이 닫히면서 발생하는 소리.
장음(Bowel Sounds)이나 호흡음(Respiratory Sounds)과 함께
청진 및 바이오 사운드 AI 연구에서 가장 핵심적으로 다뤄지는 생체 신호.
1. 정상 심음: "두근두근"의 비밀 (S1과 S2)
건강한 성인의 심장을 청진하면
규칙적으로 두 개의 소리가 한 쌍을 이루며 반복됩니다.
이를 각각
S1(제1심음)과 S2(제2심음)라고 합니다.
S1 (제1심음, "두~" / Lub):
심실이 수축을 시작할 때,
피가 심방으로 역류하지 않도록 삼차판막과 승모판막(방실판막)이 닫히는 소리.
S2에 비해 톤이 낮고(Low-pitched) 소리가 조금 더 길게 지속.
심장의 수축기(Systole) 시작을 알리는 신호.
S2 (제2심음, "픈~" / Dub):
심실 수축이 끝나고 이완할 때,
대동맥과 폐동맥으로 나간 피가 심실로 역류하지 않도록
대동맥판막과 폐동맥판막(반월판막)이 닫히는 소리.
S1에 비해 톤이 높고(High-pitched) 짧고 선명하게 뚝 끊기는 소리.
심장의 이완기(Diastole) 시작을 알리는 신호.
2. 비정상 심음: 질환을 의심할 수 있는 소리 (S3, S4 및 심잡음)
S3 (제3심음): S2 직후 이완기 초기에 심실로 피가 급격히 유입되면서 심실 벽이 떨려 나는 소리입니다.
(젊은 층이나 임산부는 정상일 수 있으나, 노년층에서는 심부전을 의심합니다.)
S4 (제4심음): S1 직전 이완기 말기에 심방이 쥐어짜며 심실로 피를 밀어낼 때 나는 소리입니다. 심실 벽이 딱딱해져 있을 때 발생합니다. (고혈압, 심근비대 등과 관련이 있습니다.)
심잡음 (Heart Murmur): 판막이 좁아지거나(협착) 제대로 닫히지 않아(폐쇄부전) 피가 소용돌이치며(와류) 나는 "쉭-, 슉-" 하는 거친 바람 소리입니다.
3. AI 신호 처리 및 오디오 분석 관점에서의 심음
장음(Bowel Sounds) 데이터와 비교했을 때,
심음은 데이터 분석 측면에서 다음과 같은 독특한 매커니즘을 가집니다.
고도의 주기성 (Periodicity): 불규칙하고 간헐적인 '버스트(Burst)' 형태를 띠는 장음과 달리, 심음은 일정한 심박수(BPM)에 따라 매우 규칙적이고 반복적인 패턴을 보입니다.
세그멘테이션(Segmentation)의 중요성: AI 연구 시 심음 오디오 파일에서 어디가 S1이고 어디가 S2인지 구간을 정확히 나누는(Segmentation) 전처리가 핵심입니다.
클래스 불균형 양상의 차이: 정상 심음 데이터는 S1-S2-휴지기가 기계처럼 반복되므로 불균형이 적지만, 심잡음(Murmur)이나 부정맥 같은 특정 '이상 신호'를 탐지할 때는 정상 데이터에 비해 이상치 데이터가 현저히 적어 심한 클래스 불균형 문제를 겪게 됩니다. 이때도 질문자님이 쓰신 확률 집계나 시간적 흐름 분석 기법이 유용하게 쓰일 수 있습니다.
10시간짜리 장음 녹음 파일에서 "지금 요 0.5초 동안 '꼬르륵' 소리가 났는가?"를 실시간으로 정확히 짚어내는 능력.
이 정확도가 98%라는 것은 100초 중 98초는 정확한 위치를 찾아냈다는 뜻
리코딩 레벨(Recording-level) 정확도: "파일 한 개 통째로 분석"
환자가 제출한 30분짜리 녹음 파일 1개를 통째로 분석한 뒤, "이 환자의 녹음 파일에 이상 장음(SIBO 신호 등)이 포함되어 있는가?"라는 최종 진단을 내리는 능력.
이 정확도가 99%라는 것은 환자 파일 100개를 검사했을 때 99개 파일의 유무 진단을 완벽하게 맞혔다는 뜻
본 기술은 특정 신호가 아주 가끔만 발생하는 열악한 환경에서도 초 단위 분석 정확도 98%, 전체 파일 분석 정확도 99%라는 압도적인 성능을 증명했습니다. 특히 AI가 순간적인 소음에 흔들리지 않도록 시간의 흐름을 고려한 보정 기술을 더해, 장시간 녹음 데이터를 안정적이고 신뢰성 있게 분석할 수 있는 핵심 기반을 마련했습니다.
배경 및 목적
전통 청진은 짧은 시간·주관적 해석의 한계가 큽니다.
디지털 신호 처리 + AI를 통해 장음을 디지털 바이오마커로 발전시켜, 비침습적·지속적 위장관 운동성(motility) 모니터링과 질환 탐지에 활용하고자 함.
기존 방법의 한계: 잡음 민감성, 어노테이션 불일치, 클래스 불균형, 실시간 장시간 분석 어려움, 대부분 frame-level에 국한.
방법론
데이터셋
Ficek et al. 공개 데이터셋 (Kaggle): 1,606 WAV 파일 (약 80%에 장음 이벤트 존재).
전문 위장관의가 2초 클립 단위로 수동 어노테이션 (single-burst, double-burst, mixed 등 하위 분류 + non-bowel).
File-level: Maximum Probability Aggregation (MPA, threshold τ=0.70)으로 통합.
두 가지 splitting protocol (Kaggle 원본 split + random 85/15 split)로 검증.
주요 결과
Kaggle split 기준
Frame-level: Accuracy 0.9884 ± 0.00049, Sensitivity 0.9544, F1 0.9548, AP 0.9918, AUC 0.9990
File-level: Accuracy 0.9979, F1 0.9970
85/15 split 기준
Frame-level: Accuracy 0.9876, Sensitivity 0.9632, F1 0.9620
File-level: Accuracy 0.9984, F1 0.9989, AUC 0.9996
기존 연구(Ficek et al. 97.4–97.7% accuracy / 71–77% sensitivity, Yu et al., Matynia 등)보다 높은 민감도와 안정성을 보였으며, 특히 파일 전체 수준에서 매우 일관된 성능을 나타냈습니다. 시각화(Fig. 4)에서도 실제 이벤트와 예측이 잘 일치하며, 무음 구간에서 false positive가 거의 없었습니다.
논의 및 임상적 의미
강점: 주파수 대역 특성을 명시적으로 모델링한 band-aware 구조, 경량·효율적, 프레임 → 파일 수준 통합 평가, 불균형 데이터에서도 robust.
임상 적용 가능성: 장시간 연속 녹음에서 신뢰할 수 있는 장음 이벤트 탐지 → 위장관 운동성 분석, preterm infant 모니터링, 기능성 위장관 질환(dysmotility) 비침습적 평가 등에 활용 가능.
bowel sound 통시적 연구
1. Du X et al. (2019)
Noninvasive Diagnosis of Irritable Bowel Syndrome via Bowel Sound Features: Proof of Concept Clinical and Translational Gastroenterology 인용 수 ≈ 47
주요 기여: 장음 특징(26개)을 추출해 logistic regression ML 모델로 IBS 환자와 건강인을 구분. Leave-one-out CV에서 민감도 0.90, 특이도 0.92 수준의 proof-of-concept 결과 제시. 의의: 장음 분석을 실제 임상 진단(특히 IBS)으로 연결한 초기 고영향력 연구. 비침습적·저비용 진단 가능성을 처음으로 구체적으로 보여줌.
기능성 위장관 질환인 과민성 장 증후군(IBS)은
현재 Rome 기준에 기반한 증상 진단과 기질적 질환 배제가 주를 이룹니다.
침습적 검사 없이 간단하고 객관적으로 진단할 수 있는
방법이 필요하다는 문제의식에서 출발한
proof-of-concept(개념증명) 연구입니다.
장음(bowel sound)을 분석하여
IBS를 비침습적으로 식별할 수 있는지 탐색했습니다.
연구 방법
연구 설계: 진단적 case-control 연구 (예비 연구)
대상: IBS 환자군과 건강 대조군
데이터 수집: 특수 개발된 음향 장치(acoustic belt)로 장음 녹음
분석 기법:
장음에서 시간 영역(time-domain) 8개 + 주파수 영역(frequency-domain) 14~18개 등 총 약 26개 음향 특징 추출
특히 이동성 운동 복합체(MMC)와 장 운동성과 관련된 특징(진폭 amplitude, burst 특성, 음성분 간 간격 component interval time)이 중요하게 선별됨
로지스틱 회귀 기반 머신러닝 모델 개발 → IBS Acoustic Index 산출하여 IBS vs 비-IBS 분류
migrating motor complex와 장운동성
1. 이동성 운동 복합체(MMC)란?
공복 상태에서 소장에서 발생하는 주기적 강력 수축파.
주기: 건강한 성인에서 약 90~120분마다 한 번씩 발생
기능: “장 청소부(housekeeper)” 역할 — 음식물 찌꺼기, 세균, 점액을 대장 쪽으로 밀어내는 phase III 강수축이 핵심
Phase I → II → III → I 로 순환
이 MMC의 강도·주기·조율이 깨지면 장음의 음향적 패턴이 크게 달라집니다.
IBS 환자에서는 MMC 빈도 감소, 불규칙한 클러스터 수축, 과도한 운동성 등이 흔히 관찰.
2. 3가지 특징
① Amplitude (진폭) / Sound Index
의미: 장음의 크기(에너지)를 정량화한 지표. 단순 최대 진폭이 아니라 일정 시간 동안의 절대 진폭 합(Sound Index)을 주로 사용.
생리적 근거: MMC phase III처럼 강력한 수축이 일어나면 장 내용물(가스+액체)이 빠르고 힘차게 이동하면서 더 큰 소리가 납니다.
IBS에서의 변화:
일부 IBS亚型(특히 SIBO 동반)에서는 MMC phase III 빈도가 줄어들어 전체 음량이 감소하거나,
반대로 과운동성 구간에서는 국소적으로 높은 진폭이 나타남.
Du 연구팀의 이전 연구(2018)에서도 Sound Index가 MMC 주기를 잘 추적하는 바이오마커임을 이미 확인.
② Burst 특성 (버스트 특성)
의미: 하나의수축파에 해당하는 소리의 군집(cluster)을 의미.
Burst duration (지속시간)
Burst 수 (일정 시간 내 발생 횟수)
Burst 내부 강도 변화
생리적 근거: 정상 MMC phase III는 비교적 규칙적이고 강한 단일 버스트 형태로 나타납니다. 반면 IBS에서는 clustered contractions(군집 수축)이나 불규칙한 다중 버스트가 증가.
IBS에서의 변화: 버스트 빈도 증가 또는 지속시간 단축/연장 등 리듬이 깨짐.
③ Component interval time (음성분 간 간격)
의미: 개별 소리 성분 사이의 시간 간격 (sound-to-sound interval).
생리적 근거: 수축과 수축 사이의 리듬, 즉 장 평활근의 조율(coordination)을 반영.
IBS에서의 변화 (가장 잘 알려진 소견):
건강인 공복 장음 간격: 평균 약 1,700 ms
IBS 환자: 평균 약 500 ms 정도로 현저히 짧음 (Craine et al., 1999 이후 여러 연구에서 재현)
이는 빠르고 불규칙한 수축이 연속적으로 일어나는 운동성 이상을 의미합니다.
3. Du et al. 2019 연구에서 이 특징들이 모델에서 가장 중요했던 이유
연구팀은 총 26개의 시간영역 + 주파수영역 특징을 추출한 후, 로지스틱 회귀로 IBS Acoustic Index를 만들었습니다.
그 결과 상위 3개 중요 특징이 모두 MMC·운동성과 직결된 위의 지표였습니다.
이유:
이 특징들은 IBS의 핵심 병태생리(운동성 이상 + MMC 변화)를 가장 직접적으로 포착
주파수 영역 특징보다 시간 영역 특징이 더 큰 기여도를 보임 (운동 리듬 자체가 변하기 때문)
기존 manometry(압력 측정) 소견과 잘 일치하는 음향적 surrogate marker 역할을 함
4. 임상적 의미 (통합의학 관점)
이 세 가지 특징은 단순한 “소리 크기”가 아니라 장 운동의 질(quality)을 반영합니다.
Amplitude + Burst → 수축 강도
Component interval time → 수축 리듬과 조율
따라서 IBS 환자에서 흔히 보이는
운동 과다/과소 혼재
MMC phase III 감소
불규칙한 클러스터 수축
을 비침습적으로 포착할 수 있는 가능성을 보여준 것입니다. 이 기술이 발전하면 향후
SIBO 동반 IBS 선별
치료 전후 운동성 변화 모니터링
한의학적 치료(침, 한약, 식이)가 실제 장 운동에 미치는 영향을 객관적으로 평가
하는 데에도 유용할 수 있습니다.
주요 결과
개발된 모델은 IBS 환자와 건강인을 약 87% 민감도(sensitivity)와 87% 특이도(specificity)로 구분 (독립 검증 코호트에서 확인)
IBS 환자에서 장음의 특정 패턴(운동성 관련 지표)이 유의하게 다르게 나타남
이는 장 운동 이상을 반영하는 객관적 바이오마커로서의 가능성을 제시
2. Nowak JK et al. (2021)
Automated Bowel Sound Analysis: An Overview Sensors 21(16):5294 인용 수 ≈ 48
주요 기여: 장음 분석의 역사, 신호 전처리(웨이블릿, spectrogram 등), 특징 추출, 전통 ML/DL 방법, 공개 데이터셋(Ficek 등), 임상 적용 사례를 체계적으로 정리한 종합 리뷰. 의의: 이 분야 최고 수준의 입문·참고 문헌. 이후 대부분의 DL 연구가 이 논문을 인용하며 기반으로 삼음. (Nowak 그룹의 Ficek 데이터셋도 이 맥락에서 중요)
자동화된 장음(Bowel Sound, BS) 분석 기술은
2000년대 초반에 이미 상당한 수준으로 발전하여
90% 이상의 정확도를 달성했으나,
방법론에 대한 합의(consensus)가 부족하여 아직 임상에서 의사들이 실제로 사용할 수 있는 도구로 자리 잡지 못했다.
상세 요약
1. 연구 배경 및 목적
장음 분석은 오랜 역사를 가진 비침습적 검사법이지만, 자동화·객관화가 어렵다는 한계가 있음.
최근 디지털 신호 처리와 머신러닝 기술의 발전으로 자동 분석 가능성이 크게 높아짐.
본 리뷰는 장음 녹음부터 분석까지의 다양한 접근법을 체계적으로 정리하고, 현재 상황과 한계를 지적하는 것을 목적으로 함.
2. 주요 내용
역사적 발전
2000년대 초반부터 이미 웨이블릿 변환(Wavelet transform), 다층 퍼셉트론(Multi-layer perceptron), 독립 성분 분석(Independent Component Analysis), ARMA 모델 등 다양한 기법으로 90% 이상의 정확도를 달성한 연구들이 다수 보고됨.
그러나 이러한 성과에도 불구하고 표준화된 프로토콜이 없어 재현성과 일반화가 어려움.
분석 방법론의 다양성 리뷰에서는 다음과 같은 접근법들을 포괄적으로 다룸:
신호 획득 방법 (마이크, 압전 센서, 웨어러블 기기 등)
전처리 및 잡음 제거 기법
특징 추출 (시간 영역, 주파수 영역, MMC 관련 특징 등)
분류 알고리즘 (전통적 머신러닝 → 딥러닝)
임상 적용 가능성
IBS, IBD, 장 운동 장애, 수술 후 회복 평가 등에서 진단적 가치가 있음.
특히 IBS에서는 장 운동성 변화(MMC 이상)를 반영하는 음향 특징(진폭, 버스트, 간격 등)이 중요한 바이오마커로 작용할 수 있음 (Du et al. 2019 연구와 연계).
3. 결론 및 한계 (저자 강조점)
기술적으로는 이미 높은 정확도를 달성했으나, 임상 현장에서 사용 가능한 형태로 발전하지 못함.
3. Sitaula C et al. (2022)
Neonatal Bowel Sound Detection Using Convolutional Neural Network and Laplace Hidden Semi-Markov Model IEEE/ACM Transactions on Audio, Speech, and Language Processing 인용 수 ≈ 46
주요 기여: CNN + Laplace HSMM 하이브리드 모델로 신생아 장음(peristalsis vs non-peristalsis)을 자동 탐지. 약 90% 정확도 달성. 의의: 신생아 중환자실 등 실제 임상 환경에 특화된 DL 적용 사례. 연속 신호에서 이벤트 탐지 정확도를 높인 점이 높게 평가됨.
신생아(특히 미숙아)의 장음(bowel sound)을 자동으로 검출하기 위해
Convolutional Neural Network (CNN)와
Laplace Hidden Semi-Markov Model (HSMM)을 결합한 하이브리드 딥러닝 모델을 제안했습니다.
신생아 중환자실(NICU)에서
청진을 보조할 수 있는 실용적 도구를 목표로 합니다.
상세 요약
1. 연구 배경
신생아(특히 미숙아)의 장 기능 평가는 영양 공급, 괴사성 장염(NEC) 위험 평가, 수술 후 회복 판단 등에서 매우 중요합니다.
전통적인 청진(auscultation)은 비침습적이고 저렴하지만, 신생아는 호흡음·심음·기타 잡음이 많아 장음 구분이 어렵고 주관적입니다.
따라서 자동화된 장음 검출 기술이 필요하다는 문제의식에서 출발.
2. 제안 방법
주요 모델: CNN + Laplace Hidden Semi-Markov Model 하이브리드 구조
CNN: 장음의 시간-주파수 특징(스펙트로그램 등)을 자동으로 학습하여 peristalsis sound(장음) vs non-peristalsis sound(잡음)을 분류
Laplace HSMM: 장음이 시간적으로 연속적으로 발생하는 특성을 모델링 (상태 전이와 지속 시간 모델링에 강점)
기존 전통적 신호처리 방법이 아닌 딥러닝 기반 end-to-end 접근을 시도.
3. 주요 결과
정확도(Accuracy): 89.81%
AUC (Area Under Curve): 83.96%
신생아 장음 검출에서 비교적 높은 성능을 보이며, 특히 잡음이 많은 실제 임상 환경에서도 robust한 검출이 가능함을 제시.
임상적 의의 및 한계
의의
신생아·미숙아에서 비침습적·객관적 장음 모니터링 가능성을 높임
NICU에서 실시간으로 장 기능을 보조할 수 있는 잠재적 도구
4. Baronetto A et al. (2024)
Multiscale Bowel Sound Event Spotting in Highly Imbalanced Wearable Monitoring Data (추가로 2025년 IBD 적용 연구도 있음) 인용 수 ≈ 7~10 (최근 논문이라 아직 상승 중, 하지만 인용 빈도 높음)
주요 기여: 웨어러블(스마트 티셔츠) 연속 녹음에서 고도로 불균형한 데이터 속 장음 이벤트를 multiscale spotting (Efficient-U-Net 기반)으로 탐지. 실제 장시간 모니터링에 강건한 프레임워크 제시. 의의: 연구실 환경을 넘어 웨어러블·실시간·장시간 모니터링으로 확장한 대표적 고영향력 연구. Baronetto 그룹의 연속 연구 시리즈(2023~2025)가 현재 이 분야 최전선.
웨어러블 기기에서 수집되는 장시간 연속 오디오 데이터 속에서
드물게 발생하는 장음(Bowel Sound, BS)을 정확하게 검출하기 위해
멀티스케일(multiscale) 스포팅 모델을 개발했습니다.
특히
데이터 불균형(imbalanced data) 문제를 해결하는 데 중점을 두었습니다.
상세 요약
1. 연구 배경 및 목적
기존 장음 분석 연구는 주로 짧은 녹음 구간이나 균형 잡힌 데이터를 대상으로 했음.
실제 임상·일상 환경에서는 웨어러블 기기로 수집되는 장시간 연속 데이터에서 장음이 매우 드물게 발생 → 극심한 데이터 불균형 문제 발생.
본 연구의 목적: 웨어러블 모니터링 시스템에서 연속 오디오 데이터 내 장음을 정확하고 robust하게 검출할 수 있는 멀티스케일 모델 개발.
2. 제안 방법
멀티스케일 스포팅 모델 (Multiscale Spotting Model) 개발
서로 다른 시간 스케일에서 장음 이벤트를 동시에 탐지
EffUNet 기반 스포터 사용 (효율적인 U-Net 계열 아키텍처)
주요 기술적 기여:
장시간 연속 데이터에서 희귀 이벤트(rare event) 검출에 최적화
배경 잡음에 강인한 성능
다양한 지속 시간(duration)을 가진 장음을 모두 포착 가능
3. 주요 결과
제안 모델(EffUNet spotter)은 이전 장음 검출 방법들보다 우수한 성능을 보임.
배경 잡음이 많은 실제 웨어러블 데이터 환경에서도 robust한 검출 성능 확인.
다양한 길이의 장음을 효과적으로 검출할 수 있음.
데이터 불균형 문제를 효과적으로 다루면서도 높은 검출 정확도를 유지.
임상적·실용적 의의
강점
웨어러블 기반 연속 모니터링에 최적화 → 병원뿐만 아니라 일상생활에서도 장 기능을 실시간으로 추적 가능
장음이 드물게 발생하는 장시간 녹음 데이터에서도 실용적으로 사용할 수 있는 모델
향후 스마트 의류(smart T-shirt) 등에 내장된 마이크와 결합하여 IBD, IBS, 장 운동 장애 환자의 재택 모니터링 도구로 발전 가능 (저자 그룹의 후속 연구에서도 IBD 분류에 적용 중)
5. Çelik Y (2026)
Deep learning-based detection of bowel sound events in continuous recordings Scientific Reports (Nature) 인용 수: 아직 낮음 (2026년 3월 출판, 최신)
주요 기여: Band-aware dual-branch 모델 (저주파·고주파 CWT 별도 처리 + SE attention). Frame-level >98% 정확도, recording-level >99% 정확도. 클래스 불균형과 장시간 녹음에 강건한 통합 의사결정 전략(MPA) 제안. (사용자님이 이전에 요약 요청하신 논문)
의의: 현재까지 가장 높은 성능을 보인 continuous recording용 최신 DL 아키텍처. 방법론적 완성도가 높아 향후 벤치마크로 자리잡을 가능성 큼.