Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing: EMNLP 2023 - Industry Track, Singapore, December 6-10, 2023 - researchr publication

researchr

You are not signed in
Sign in
Sign up

Mingxuan Wang, Imed Zitouni, editors, Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing: EMNLP 2023 - Industry Track, Singapore, December 6-10, 2023. Association for Computational Linguistics, 2023. [doi]

Conference: emnlp2023

Abstract is missing.

Frontmatter [doi]

BeautifulPrompt: Towards Automatic Prompt Engineering for Text-to-Image SynthesisTingfeng Cao, Chengyu Wang 0001, Bingyan Liu, Ziheng Wu, Jinhui Zhu, Jun Huang 0007. 1-11 [doi]

Enhancing Language Model with Unit Test Techniques for Efficient Regular Expression GenerationChenhui Mao, Xiexiong Lin, Xin Jin, Xin Zhang. 12-19 [doi]

A Comparative Analysis of Task-Agnostic Distillation Methods for Compressing Transformer Language ModelsTakuma Udagawa, Aashka Trivedi, Michele Merler, Bishwaranjan Bhattacharjee. 20-31 [doi]

Towards Effective Automatic Debt Collection with Persona AwarenessTong Zhang, Junhong Liu, Chen Huang, Jia Liu, Hongru Liang, Zujie Wen, Wenqiang Lei. 32-45 [doi]

Gatekeeper to save COGS and improve efficiency of Text PredictionNidhi Tiwari, Sneha Kola, Milos Milunovic, Si-Qing Chen, Marjan Slavkovski. 46-53 [doi]

Efficient Transformer Knowledge Distillation: A Performance ReviewNathan Brown, Ashton Williamson, Tahj Anderson, Logan Lawrence. 54-65 [doi]

CDD: A Large Scale Dataset for Legal Intelligence ResearchChangzhen Ji, Yating Zhang, Adam Jatowt, Haipang Wu. 66-73 [doi]

MUST&P-SRL: Multi-lingual and Unified Syllabification in Text and Phonetic Domains for Speech Representation LearningNoé Tits. 74-82 [doi]

Personalized Dense Retrieval on Global Index for Voice-enabled Conversational SystemsMasha Belyi, Charlotte Dzialo, Chaitanya Dwivedi, Prajit Muppidi, Kanna Shimizu. 83-92 [doi]

Text2Topic: Multi-Label Text Classification System for Efficient Topic Detection in User Generated Content with Zero-Shot CapabilitiesFengjun Wang, Moran Beladev, Ofri Kleinfeld, Elina Frayerman, Tal Shachar, Eran Fainman, Karen Lastmann Assaraf, Sarai Mizrachi, Benjamin Wang. 93-103 [doi]

Deep Metric Learning to Hierarchically Rank - An Application in Product RetrievalKee Kiat Koo, Ashutosh Joshi, Nishaanth Reddy, Karim Bouyarmane, Ismail B. Tutar, Vaclav Petricek, Changhe Yuan. 104-112 [doi]

A Pretrained Language Model for Cyber Threat IntelligenceYoungja Park, Weiqiu You. 113-122 [doi]

SAMP: A Model Inference Toolkit of Post-Training Quantization for Text Processing via Self-Adaptive Mixed-PrecisionRong Tian, Zijing Zhao, Weijie Liu 0002, Haoyan Liu, Weiquan Mao, Zhe Zhao 0006, Kan Zhou. 123-130 [doi]

KD-Boost: Boosting Real-Time Semantic Matching in E-commerce with Knowledge DistillationSanjay Agrawal 0006, Vivek Sembium, Ankith M. S. 131-141 [doi]

Multi-teacher Distillation for Multilingual Spelling CorrectionJingfen Zhang, Xuan Guo, Sravan Bodapati, Christopher Potts. 142-151 [doi]

Does Named Entity Recognition Truly Not Scale Up to Real-world Product Attribute Extraction?Wei-Te Chen, Keiji Shinzato, Naoki Yoshinaga 0001, Yandi Xia. 152-159 [doi]

Investigating Table-to-Text Generation Capabilities of Large Language Models in Real-World Information Seeking ScenariosYilun Zhao 0001, Haowei Zhang, Shengyun Si, Linyong Nan, Xiangru Tang, Arman Cohan. 160-175 [doi]

TMID: A Comprehensive Real-world Dataset for Trademark Infringement Detection in E-CommerceTongxin Hu, Zhuang Li, Xin Jin, Lizhen Qu, Xin Zhang. 176-184 [doi]

Joint Dialogue Topic Segmentation and Categorization: A Case Study on Clinical Spoken ConversationsZhengyuan Liu, Siti Umairah Md. Salleh, Hong Choon Oh, Pavitra Krishnaswamy, Nancy F. Chen. 185-193 [doi]

AdapterDistillation: Non-Destructive Task Composition with Knowledge DistillationJunjie Wang, Yicheng Chen, Wangshu Zhang, Sen Hu, Teng Xu 0007, Jing Zheng. 194-201 [doi]

PROMINET: Prototype-based Multi-View Network for Interpretable Email Response PredictionYuqing Wang, Prashanth Vijayaraghavan, Ehsan Degan. 202-215 [doi]

Retrieval-Enhanced Dual Encoder Training for Product MatchingJustin Chiu. 216-222 [doi]

WordArt Designer: User-Driven Artistic Typography Synthesis using Large Language ModelsJun-Yan He, Zhi-Qi Cheng, Chenyang Li, Jingdong Sun, Wangmeng Xiang, Xianhui Lin, Xiaoyang Kang 0002, Zengke Jin, Yusen Hu, Bin Luo, Yifeng Geng, Xuansong Xie. 223-232 [doi]

Lattice Path Edit Distance: A Romanization-aware Edit Distance for Extracting Misspelling-Correction Pairs from Japanese Search Query LogsNobuhiro Kaji. 233-242 [doi]

Learning Multilingual Sentence Representations with Cross-lingual Consistency RegularizationPengzhi Gao, Liwen Zhang, Zhongjun He, Hua Wu 0003, Haifeng Wang 0001. 243-262 [doi]

Unveiling Identity Biases in Toxicity Detection : A Game-Focused Dataset and Reactivity Analysis ApproachJosiane Van Dorpe, Zachary Yang, Nicolas Grenon-Godbout, Grégoire Winterstein. 263-274 [doi]

ORANGE: Text-video Retrieval via Watch-time-aware Heterogeneous Graph Contrastive LearningYucheng Lin, Tim Chang, Yaning Chang, Jianqiang Ma, Donghui Li, Ting Peng, Zang Li, Zhiyi Zhou, Feng Wang. 275-283 [doi]

Compute-Efficient Churn Reduction for Conversational AgentsChristopher Hidey, Sarthak Sarthak. 284-293 [doi]

Empower Large Language Model to Perform Better on Industrial Domain-Specific Question AnsweringFangkai Yang, Pu Zhao 0004, Zezhong Wang 0004, Lu Wang, Bo Qiao 0001, Jue Zhang, Mohit Garg, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang. 294-312 [doi]

Enhancing Extreme Multi-Label Text Classification: Addressing Challenges in Model, Data, and EvaluationDan Li, Zi Long Zhu, Janneke van de Loo, Agnes Masip Gomez, Vikrant Yadav, Georgios Tsatsaronis, Zubair Afzal. 313-321 [doi]

Query-aware Multi-modal based Ranking Relevance in Video SearchChengcan Ye, Ting Peng, Tim Chang, Zhiyi Zhou, Feng Wang. 322-330 [doi]

Coordinated Replay Sample Selection for Continual Federated LearningJack Good, Jimit Majmudar, Christophe Dupuy, Jixuan Wang, Charith Peris, Clement Chung, Richard S. Zemel, Rahul Gupta 0001. 331-342 [doi]

Building Real-World Meeting Summarization Systems using Large Language Models: A Practical PerspectiveMd. Tahmid Rahman Laskar, Xue-Yong Fu, Cheng Chen, Shashi Bhushan TN. 343-352 [doi]

Creator Context for Tweet RecommendationSpurthi Amba Hombaiah, Tao Chen 0008, Mingyang Zhang 0001, Michael Bendersky, Marc Najork, Matt Colen, Sergey Levi, Vladimir Ofitserov, Tanvir Amin. 353-363 [doi]

AdaBERT-CTC: Leveraging BERT-CTC for Text-Only Domain Adaptation in ASRTyler Vuong, Karel Mundnich, Dhanush Bekal, Veera Raghavendra Elluru, Srikanth Ronanki, Sravan Bodapati. 364-371 [doi]

Conversing with databases: Practical Natural Language QueryingDenis Kochedykov, Fenglin Yin, Sreevidya Khatravath. 372-379 [doi]

AART: AI-Assisted Red-Teaming with Diverse Data Generation for New LLM-powered ApplicationsBhaktipriya Radharapu, Kevin Robinson, Lora Aroyo, Preethi Lahoti. 380-395 [doi]

Speakerly: A Voice-based Writing Assistant for Text CompositionDhruv Kumar 0005, Vipul Raheja, Alice Kaiser-Schatzlein, Robyn Perry, Apurva Joshi, Justin Hugues-Nuger, Samuel Lou, Navid Chowdhury. 396-407 [doi]

Are ChatGPT and GPT-4 General-Purpose Solvers for Financial Text Analytics? A Study on Several Typical TasksXianzhi Li, Samuel Chan, Xiaodan Zhu, Yulong Pei, Zhiqiang Ma, Xiaomo Liu, Sameena Shah. 408-422 [doi]

CL-QR: Cross-Lingual Enhanced Query Reformulation for Multi-lingual Conversational AI AgentsZhongkai Sun, Zhengyang Zhao, Sixing Lu, Chengyuan Ma, Xiaohu Liu, Xing Fan, Wei Shen, Chenlei Guo. 423-431 [doi]

Improving Contextual Query Rewrite for Conversational AI Agents through User-preference Feedback LearningZhongkai Sun, Yingxue Zhou, Jie Hao, Xing Fan, Yanbin Lu, Chengyuan Ma, Wei Shen, Chenlei Guo. 432-439 [doi]

Scaling Neural ITN for Numbers and Temporal Expressions in Tamil: Findings for an Agglutinative Low-resource LanguageBhavuk Singhal, Sindhuja Gopalan, Amrith Krishna, Malolan Chetlur. 440-450 [doi]

EELBERT: Tiny Models through Dynamic EmbeddingsGabrielle Cohn, Rishika Agarwal, Deepanshu Gupta, Siddharth Patwardhan. 451-459 [doi]

Gold Standard Bangla OCR Dataset: An In-Depth Look at Data Preprocessing and Annotation ProcessesHasmot Ali, AKM Shahariar Azad Rabby, Md. Majedul Islam, A. k. m Mahamud, Nazmul Hasan, Fuad Rahman 0001. 460-470 [doi]

PILLOW: Enhancing Efficient Instruction Fine-tuning via Prompt MatchingZhenting Qi, Xiaoyu Tan, Shaojie Shi, Chao Qu, Yinghui Xu, Yuan Qi. 471-482 [doi]

Welcome to the Real World: Efficient, Incremental and Scalable Key Point AnalysisLilach Eden, Yoav Kantor, Matan Orbach, Yoav Katz, Noam Slonim, Roy Bar-Haim. 483-491 [doi]

Automatic Linking of Judgements to UK Supreme Court HearingsHadeel Saadany, Constantin Orasan. 492-500 [doi]

Automatic Marketing Theme and Commodity Construction System for E-commerceZhiping Wang, Peng Lin, Hainan Zhang, Hongshen Chen, Tianhao Li, Zhuoye Ding, Sulong Xu, Jinghe Hu. 501-508 [doi]

Towards Safer Operations: An Expert-involved Dataset of High-Pressure Gas Incidents for Preventing Future FailuresShumpei Inoue, Minh-Tien Nguyen, Hiroki Mizokuchi, Tuan-Anh D. Nguyen, Huu Hiep Nguyen, Dung Le. 509-521 [doi]

An Auxiliary Task Boosted Multi-task Learning Method for Service Account Retrieval with Limited Human AnnotationYuanzhou Yao, Zhao Zhang 0011, Kaijia Yang, Huasheng Liang, Qiang Yan, Yongjun Xu. 522-531 [doi]

VKIE: The Application of Key Information Extraction on Video TextSiyu An, Ye Liu, Haoyuan Peng, Di Yin. 532-540 [doi]

Investigating the Role and Impact of Disfluency on SummarizationVarun Nathan, Ayush Kumar, Jithendra Vepa. 541-551 [doi]

InsightNet : Structured Insight Mining from Customer FeedbackSandeep Sricharan Mukku, Manan Soni, Chetan Aggarwal, Jitenkumar Rana, Promod Yenigalla, Rashmi Patange, Shyam Mohan. 552-566 [doi]

E2E Spoken Entity Extraction for Virtual AgentsKaran Singla, Yeon-Jun Kim, Srinivas Bangalore. 567-574 [doi]

Generative Models for Product Attribute ExtractionAnsel Blume, Nasser Zalmout, Heng Ji, Xian Li. 575-585 [doi]

CarExpert: Leveraging Large Language Models for In-Car Conversational Question AnsweringMd. Rashad Al Hasan Rony, Christian Suess, Sinchana Ramakanth Bhat, Viju Sudhi, Julia Schneider, Maximilian Vogel, Roman Teucher, Ken E. Friedl, Soumya R. Sahoo. 586-604 [doi]

BUSTER: a "BUSiness Transaction Entity Recognition" datasetAndrea Zugarini, Andrew Zamai, Marco Ernandes, Leonardo Rigutini. 605-611 [doi]

Multi-word Tokenization for Sequence CompressionLeonidas Gee, Leonardo Rigutini, Marco Ernandes, Andrea Zugarini. 612-621 [doi]

JarviX: A LLM No code Platform for Tabular Data Analysis and OptimizationShangching Liu, Shengkun Wang, Tsungyao Chang, Wenqi Lin, Chung-Wei Hsiung, Yi-Chen Hsieh, Yu-Ping Cheng, Sian-Hong Luo, Jianwei Zhang. 622-630 [doi]

Retrieve and Copy: Scaling ASR Personalization to Large CatalogsSai Muralidhar Jayanthi, Devang Kulshreshtha, Saket Dingliwal, Srikanth Ronanki, Sravan Bodapati. 631-639 [doi]

STEER: Semantic Turn Extension-Expansion Recognition for Voice AssistantsLeon Liyang Zhang, Jiarui Lu, Joel Ruben Antony Moniz, Aditya Kulkarni, Dhivya Piraviperumal, Tien Dung Tran, Nick Tzou, Hong Yu. 640-649 [doi]

Self-Criticism: Aligning Large Language Models with their Understanding of Helpfulness, Honesty, and HarmlessnessXiaoyu Tan, Shaojie Shi, Xihe Qiu, Chao Qu, Zhenting Qi, Yinghui Xu, Yuan Qi. 650-662 [doi]

InstructPTS: Instruction-Tuning LLMs for Product Title SummarizationBesnik Fetahu, ZhiYu Chen, Oleg Rokhlenko, Shervin Malmasi. 663-674 [doi]

LLM4Vis: Explainable Visualization Recommendation using ChatGPTLei Wang, Songheng Zhang, Yun Wang, Ee-Peng Lim, Yong Wang. 675-692 [doi]

DUBLIN: Visual Document Understanding By Language-Image NetworkKriti Aggarwal, Aditi Khandelwal, Kumar Tanmay, Owais Khan Mohammed, Qiang Liu, Monojit Choudhury, Hardik Hansrajbhai Chauhan, Subhojit Som, Vishrav Chaudhary, Saurabh Tiwary. 693-706 [doi]

DocumentNet: Bridging the Data Gap in Document Pre-trainingLijun Yu, Jin Miao, Xiaoyu Sun, Jiayi Chen, Alexander G. Hauptmann, Hanjun Dai, Wei Wei 0019. 707-722 [doi]

Relevance-assisted Generation for Robust Zero-shot RetrievalJihyuk Kim, Minsoo Kim, Joonsuk Park, Seung-won Hwang. 723-731 [doi]

Too much of product information : Don't worry, let's look for evidence!Aryan Jain, Jitenkumar Rana, Chetan Aggarwal. 732-738 [doi]

Harnessing LLMs for Temporal Data - A Study on Explainable Financial Time Series ForecastingXinli Yu, Zheng Chen, Yanbin Lu. 739-753 [doi]

ViGPTQA - State-of-the-Art LLMs for Vietnamese Question Answering: System Overview, Core Models Training, and EvaluationsMinh-Thuan Nguyen, Khanh-Tung Tran, Nhu-Van Nguyen, Xuan-Son Vu. 754-764 [doi]

An Integrated Search System for Korea Weather DataJinkyung Jo, Dayeon Ki, Soyoung Yoon, Minjoon Seo. 765-774 [doi]

Adaptive Hyper-parameter Learning for Deep Semantic RetrievalMingming Li, Chunyuan Yuan, Huimu Wang, Peng Wang, Jingwei Zhuo, Binbin Wang, Lin Liu, Sulong Xu. 775-782 [doi]

On Sample-Efficient Code GenerationHojae Han, Yu-Jin Kim, Byoungjip Kim, Youngwon Lee 0003, Kyungjae Lee 0002, Kyungmin Lee, Moontae Lee, Kyunghoon Bae, Seung-won Hwang. 783-791 [doi]

Batch Prompting: Efficient Inference with Large Language Model APIsZhoujun Cheng, Jungo Kasai, Tao Yu 0009. 792-810 [doi]

Graph Meets LLM: A Novel Approach to Collaborative Filtering for Robust Conversational UnderstandingZheng Chen, Ziyan Jiang, Fan Yang, Eunah Cho, Xing Fan, Xiaojiang Huang, Yanbin Lu, Aram Galstyan. 811-819 [doi]

DELPHI: Data for Evaluating LLMs' Performance in Handling Controversial IssuesDavid Q. Sun, Artem Abzaliev, Hadas Kotek, Christopher Klein, Zidi Xiu, Jason D. Williams. 820-827 [doi]

Angel: Enterprise Search System for the Non-Profit IndustrySaiful Haq, Ashutosh Sharma, Pushpak Bhattacharyya. 828-835 [doi]

runs on WebDSL