생각많은 소심남의 연구노트
    • English
  • Home
  • 소개
  • 블로그
  • 출간물
  • 활동
    Data-Driven Reinforcement Learning for Optimal Motor Control in Washing Machines

    2024 IEEE Conference on Artificial Intelligence (CAI), Singapore

    Chanseok Kang Guntae Bae Daesung Kim Kyoungwoo Lee Dohyeon Son Chul Lee Jaeho Lee Jinwoo Lee Jae Woong Yun

    LG Electronics AI Lab

    IEEE DOI

    TL;DR

    Delayed Online Update는 실제 세탁기 운전 데이터와 continual offline reinforcement learning을 결합해 세탁물 시나리오를 모두 수동 규칙으로 작성하지 않고도 탈수 구간의 load balancing을 개선합니다.

    Delayed online update framework for continual offline reinforcement learning.

    Delayed online update framework for continual offline reinforcement learning.

    Post-deployment 개선을 위한 Delayed Online Update (DOU) workflow.

    Overview

    Problem

    현대 세탁기는 여러 운전 조건에서 세탁물 균형을 유지해야 합니다. 수동 시행착오 중심의 튜닝은 배포 이후 제어 성능을 빠르게 개선하는 데 한계가 있습니다.

    Approach

    본 논문은 세탁기 모터 제어를 위한 continual offline reinforcement learning workflow를 제안하며, 누적된 transition data와 delayed online update를 활용해 distribution shift 위험을 줄입니다.

    Outcome

    탈수 구간에서 서로 다른 세탁물 조건을 포함한 실험을 통해 균형 유지 성능 개선을 보고합니다.

    Method

    1. 실제 세탁기 운전에서 transition data를 수집합니다.
    2. 탈수 구간 모터 제어를 위한 offline RL policy를 학습합니다.
    3. 새로운 online interaction data를 delay window 동안 누적합니다.
    4. 짧은 online rollout마다 즉시 반응하는 대신 확장된 dataset으로 policy를 갱신합니다.

    Offline and online data distributions across three tasks.

    Offline and online data distributions across three tasks.

    선택된 laundry task에서 offline/online data coverage 비교.

    Results

    Average Success Rate

    Average success rate comparison across laundry tasks.

    Average success rate comparison across laundry tasks.

    평가한 laundry task 전반에서 DOU variant가 baseline보다 높은 평균 success rate를 보입니다.

    Multi-Task Laundry Set

    Multi-task laundry configurations.

    Multi-task laundry configurations.

    Multi-task evaluation에 사용한 대표 laundry configuration입니다.

    Unseen Tasks

    Unseen laundry configurations.

    Unseen laundry configurations.

    Generalization 평가를 위한 unseen laundry combination입니다.

    Production Device

    Production-ready washer product using offline reinforcement learning.

    Production-ready washer product using offline reinforcement learning.

    Offline RL control approach가 적용된 production-ready target device입니다.

    Videos

    Supplemental motion example.

    Naive rule-based baseline motion.

    Proposed learned motion.

    Poster

    IEEE CAI 2024 poster.

    IEEE CAI 2024 poster.

    Citation

    @inproceedings{kang2024dataDrivenRLWasher,
      title     = {Data-Driven Reinforcement Learning for Optimal Motor Control in Washing Machines},
      author    = {Kang, Chanseok and Bae, Guntae and Kim, Daesung and Lee, Kyoungwoo and Son, Dohyeon and Lee, Chul and Lee, Jaeho and Lee, Jinwoo and Yun, Jae Woong},
      booktitle = {Proceedings - 2024 IEEE Conference on Artificial Intelligence (CAI)},
      pages     = {418--424},
      year      = {2024},
      doi       = {10.1109/CAI59869.2024.00083}
    }