paulparkinson
diff --git a/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/README.md
Lines changed: 47 additions & 0 deletions b/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/README.md
Lines changed: 47 additions & 0 deletions
diff --git a/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/config_private
Lines changed: 8 additions & 0 deletions b/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/config_private
Lines changed: 8 additions & 0 deletions
diff --git a/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/config_rag.py
Lines changed: 71 additions & 0 deletions b/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/config_rag.py
Lines changed: 71 additions & 0 deletions
diff --git a/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/copy.txt
Lines changed: 1 addition & 0 deletions b/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/copy.txt
Lines changed: 1 addition & 0 deletions
diff --git a/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/init_rag.py
Lines changed: 193 additions & 0 deletions b/‎Full-Stack-RagChatBot/FullStack-Rag-Chatbot/init_rag.py
Lines changed: 193 additions & 0 deletions
@@ -0,0 +1,47 @@
+# Integrate OCI Generative AI with LangChain
+This repo contains all the work done to develop demos on the integration between [**LangChain**](https://www.langchain.com/) and Oracle [**OCI GenAI**](https://www.oracle.com/artificial-intelligence/generative-ai/large-language-models/) Service.
+
+## OCI Generative AI Service is in GENERAL AVAILABILITY
+Consider that OCI Generative AI Service (based on Cohere models) is now (July ) 
+
+## Oracle 23ai is in GENERAL AVAILABILITY
+Consider that Oracle 23 ai database is available now
+
+## Documentation
+The development of the proposed integration is based on the example, from LangChain, provided [here](https://python.langchain.com/docs/modules/model_io/models/llms/custom_llm)
+
+**RAG** has been first described in the following [arXiv paper](https://arxiv.org/pdf/2005.11401.pdf)
+
+## Features
+* How-to build a complete, end-2-end RAG solution using LangChain and Oracle GenAI Service.
+* How-to load multiple pdf
+* How-to split pdf pages in smaller chuncks
+* How-to do semantic search using Embeddings
+* How-to use Cohere Embeddings
+* How-to use HF Embeddings
+* How-to setup a Retriever using Embeddings
+* How-to add Cohere reranker to the chain
+* How to integrate OCI GenAI Service with LangChain
+* How to define the LangChain
+* How to use the Oracle vector Db capabilities
+* How to use in-memory database capability
+
+## Oracle BOT
+Using the script [run_oracle_bot_exp.sh](./run_oracle_bot_exp.sh) you can launch a simple ChatBot that showcase Oracle GenAI service. The demo is based on docs from Oracle Database pdf documentation.
+
+You need to put in the local directory:
+* Trobleshooting.pdf
+* globally-distributed-autonomous-database.pdf
+* Oracle True cache.pdf
+* oracle-database-23c.pdf
+* oracle-globally-distributed-database-guide.pdf
+* sharding-adg-addshard-cookbook-3610618.pdf
+
+You can add more pdf. Edit [config_rag.py](./config_rag.py)
+
+## Video
+
+
+
+
+
@@ -0,0 +1,8 @@
+[DEFAULT]
+user = ocid1.user.oc1..aaaaaaaabjnsmmvrb6xp53xodn7mpl3tpbmp5skyeln45hpjh35kcjka3g2a
+fingerprint = 78:c8:06:ce:8d:ec:fa:59:11:e0:95:cb:38:cd:70:7b
+tenancy = ocid1.tenancy.oc1..aaaaaaaalfdcq4pjudpqet6h7hdwontdpij5qzeec5nag236it6x6arg7rsq
+region = us-ashburn-1
+key_file = /Users/pankatiw/Downloads/[email protected]_2024-05-21T09_18_17.616Z.pem
+COMPARTMENT_OCID = "ocid1.compartment.oc1..aaaaaaaajdyhd7dqnix2avhlckbhhkkcl3cujzyuz6jzyzonadca3i66pqjq"
+COHERE_API_KEY = "-----BEGIN PRIVATE KEY----- MIIEvwIBADANBgkqhkiG9w0BAQEFAASCBKkwggSlAgEAAoIBAQDSu5DgrYhdkRpx 8YLJZyd6uJmuWDMz6iqN9Yy9xxGj6XWNTk+aHMvumDJ451j2jCkaXXkBorADWcyo I7X5aJF/WdSzM9QTA71nVKshbCBPNW7NaQJEbknSOlaZIEk77eREKzuyY7XY8agv xCBVf06oJ8w5jzbOO38G8TWIUcnNyOJnFKI2VHkCI6RI8Bc39iPqQWG8qgQdzSy2 pwFqbZBU2xcQtbKB3ByvvDRS+YHen1FN3w64ZMne2ky8SDU9sT+94km+w0Y+Wl6A ibbgaG1LrRW3VCgg5QxfYKs4lHdLlGX2grWl6O5Ar4gcX8+x1XmoZQVamo0kg1s+ eAQkPxgFAgMBAAECggEANJJ+DYtFVKBtUkVP3Up6hyt0DZJr7bTq2mEKtFKsNDH7 NV42zioGd1bpao++uj1TyMPOeym40xEtVToZfSgI+lYxEebpbrf1Yci167/jnJcm NiEPI37HNGcA8TEkjAqocpg9i57EAGQjUw1RCrtYpmtNUAPKRq+BnHwDIKfU2l0i OFgIUDBatKlfZOlvX+CphVgEbIyrkinK3BYCSjCuY4bPInOwHc+YTYy9ihMpWeGj li1nDGG11y0Ui4IzX3w+W8Yhl0mIjTKQUPnPkAvsV/2mjKDmEvdX3nMtzE2s6MNW MOIJ7db3G38r/l34lntAAiOtoDrNiyEOYYFAFJeowQKBgQDo0eik9R0Xpx+9L85n xt88vavYq/AsZFrLfFNoCoOey5lPtkKmPxUIbdWfynujO4s9O/I4xHs1LiKO3xcE PmNu5L3Y0SydV0CK7Gj4LOLpIwFTb8wIntFYRET6+nkEz83fFyBrgVl0iA3xH7XW SiHxaQZWL2y1Yg2rCerf1n/BQQKBgQDntrLr1gJWZBVxQu69CByTndf+j1Y47iIf L3hQhSD5q8d2QACavggxpg0AvSM9bqMNtkHSh/HELpZrJZHxP3GsqbUY4cvaA3WK muretzmN8kCozcgs+dMeM7aqL+/4Xatujn4UxHt7O5eOqAzVfavwOXTF7bo9zVcc zWxtdIYhxQKBgQDnPh4pQX+sz4S5vrLu5lsyFF2L7nK1VNPNimW5T8AdR7G1t5yJ TNySK61jcZTNs0WAA3t5IMYTMwiGCVTuFR1jtnRN1qzOdiwYD+nOnZ6e2vLlMYRh B4V8ewpckc0Dl3auX2UHAkmcccoPNWTBO45tHdh6X85EdeiHemk7++uWQQKBgQCV hIXFuk29000mzarh3YcbFeJXh8R6beckumvngVA660aFHl2FfJQq/Vwsmt9Pd8HN SksE/+XY0rsLHq4ivu6qHMQX7zOsVUkWjEp8Njz0RFrG0iqWIwrA1VvMS6yMVl0V tOrUmciYR2bPjc7iP/qfw2N/iJwB3yuUEVYi9urKhQKBgQCDqwzMHpSC+IvNAomj HB6XY20MlkLkjZIbJwyw2SzLnrEgp7RsGH/bVmZonGiDQKl8xTTcG831I8+h8rEt tNM8a1Xl4sMpnFmHkmD0XV8DvsXwafBO9ygj87Au87tREcxX/8DgTn6tZSclmgdp vKDkErw6rpZmLZKFHck8lwZZBA== -----END PRIVATE KEY-----"
@@ -0,0 +1,71 @@
+# configurations for the RAG
+
+# to enable debugging info..
+DEBUG = False
+
+# book to use for augmentation
+# BOOK1 = "APISpec.pdf"
+BOOK1 = "pdfFiles/sharding-adg-addshard-cookbook-3610618.pdf"
+BOOK2 = "pdfFiles/globally-distributed-autonomous-database.pdf"
+# BOOK4 = "OnBoardingGuide.pdf"
+# BOOK5 = "CreateWorkFlow.pdf"
+# BOOK6 = "Team Onboarding.pdf"
+# BOOK7 = "workflow.pdf"
+BOOK3 = "pdfFiles/oracle-database-23c.pdf"
+BOOK4 = "pdfFiles/oracle-globally-distributed-database-guide.pdf"
+BOOK5 = "pdfFiles/Oracle True cache.pdf"
+BOOK6 = "pdfFiles/Trobleshooting.pdf"
+# BOOK12 = "OsdCode.pdf"
+
+BOOK_LIST = [BOOK1, BOOK2, BOOK3, BOOK4, BOOK5, BOOK6]
+
+
+# to divide docs in chunks
+CHUNK_SIZE = 1000
+CHUNK_OVERLAP = 50
+
+
+#
+# Vector Store (Chrome or FAISS)
+#
+# VECTOR_STORE_NAME = "FAISS"
+# VECTOR_STORE_NAME = "ORACLEDB"
+VECTOR_STORE_NAME = "CHROME"
+
+
+# type of Embedding Model. The choice has been parametrized
+# Local means HF
+EMBED_TYPE = "LOCAL"
+# see: https://huggingface.co/spaces/mteb/leaderboard
+# see also: https://github.com/FlagOpen/FlagEmbedding
+# base seems to work better than small
+# EMBED_HF_MODEL_NAME = "BAAI/bge-base-en-v1.5"
+# EMBED_HF_MODEL_NAME = "BAAI/bge-small-en-v1.5"
+EMBED_HF_MODEL_NAME = "BAAI/bge-large-en-v1.5"
+
+# Cohere means the embed model from Cohere site API
+# EMBED_TYPE = "COHERE"
+EMBED_COHERE_MODEL_NAME = "embed-english-v3.0"
+
+# number of docs to return from Retriever
+MAX_DOCS_RETRIEVED = 6
+
+# to add Cohere reranker to the QA chain
+ADD_RERANKER = False
+
+#
+# LLM Config
+#
+# LLM_TYPE = "COHERE"
+LLM_TYPE = "OCI"
+
+# max tokens returned from LLM for single query
+MAX_TOKENS = 1000
+# to avoid "creativity"
+TEMPERATURE = 0
+
+#
+# OCI GenAI configs
+#
+TIMEOUT = 30
+ENDPOINT = "https://inference.generativeai.us-chicago-1.oci.oraclecloud.com"
@@ -0,0 +1 @@
+feedback_0
@@ -0,0 +1,193 @@
+#
+# This one is to be used in Notebooks
+#
+
+# for pdf post processing
+import re
+
+import cohere
+# modified to load from Pdf
+from langchain.document_loaders import PyPDFLoader
+from langchain.text_splitter import RecursiveCharacterTextSplitter
+
+# two possible vector store
+from langchain.vectorstores import Chroma
+from langchain.vectorstores import FAISS
+
+from langchain.schema.runnable import RunnablePassthrough
+
+# removed OpenAI, using Cohere embeddings
+from langchain.embeddings import CohereEmbeddings
+from langchain.embeddings import HuggingFaceEmbeddings
+
+from langchain import hub
+
+import oci
+
+from langchain.llms import Cohere
+from langchain_community.llms.oci_generative_ai import OCIGenAI
+from oci.generative_ai_inference import generative_ai_inference_client
+
+# oci_llm is in a local file
+from oci_llm import OCIGenAILLM
+
+# config for the RAG
+from config_rag import (
+    BOOK_LIST,
+    CHUNK_SIZE,
+    CHUNK_OVERLAP,
+    VECTOR_STORE_NAME,
+    MAX_TOKENS,
+    ENDPOINT,
+    EMBED_TYPE,
+    MAX_DOCS_RETRIEVED,
+    TEMPERATURE,
+    EMBED_HF_MODEL_NAME,
+    TIMEOUT,
+    LLM_TYPE,
+)
+
+# private configs
+CONFIG_PROFILE = "DEFAULT"
+COMPARTMENT_OCID = "ocid1.compartment.oc1..aaaaaaaajdyhd7dqnix2avhlckbhhkkcl3cujzyuz6jzyzonadca3i66pqjq"
+oci_config = oci.config.from_file("~/.oci/config", CONFIG_PROFILE)
+COHERE_API_KEY = oci_config['security_token_file']
+DEBUG = True
+
+
+#
+# def load_oci_config()
+#
+def load_oci_config():
+    # read OCI config to connect to OCI with API key
+    oci_config = oci.config.from_file("~/.oci/config", CONFIG_PROFILE)
+
+    # check the config to access to api keys
+    if DEBUG:
+        print(oci_config)
+
+    return oci_config
+
+
+#
+# do some post processing on text
+#
+def post_process(splits):
+    for split in splits:
+        split.page_content = split.page_content.replace("\n", " ")
+        split.page_content = re.sub("[^a-zA-Z0-9 \n\.]", " ", split.page_content)
+        # remove duplicate blank
+        split.page_content = " ".join(split.page_content.split())
+
+    return splits
+
+
+#
+# def: Initialize_rag_chain
+#
+def initialize_rag_chain():
+    # Initialize RAG
+
+    # Loading a list of pdf documents
+    all_pages = []
+
+    # modified to load a list of pdf
+    for book in BOOK_LIST:
+        print(f"Loading book: {book}...")
+        loader = PyPDFLoader(book)
+
+        # loader split in pages
+        pages = loader.load()
+        print(f"Loaded {len(pages)} pages...")
+
+        all_pages.extend(pages)
+
+        print("PDF document loaded!")
+
+    # This split in chunks
+    # try with smaller chuncks
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=CHUNK_SIZE, chunk_overlap=CHUNK_OVERLAP
+    )
+
+    splits = text_splitter.split_documents(all_pages)
+
+    print(f"We have splitted the pdf in {len(splits)} splits...")
+
+    # some post processing
+    splits = post_process(splits)
+
+    print("Initializing vector store...")
+
+    if EMBED_TYPE == "COHERE":
+        print("Loading Cohere Embeddings Model...")
+        embed_model = CohereEmbeddings(cohere_api_key=COHERE_API_KEY)
+    if EMBED_TYPE == "LOCAL":
+        print(f"Loading HF Embeddings Model: {EMBED_HF_MODEL_NAME}")
+
+        model_kwargs = {"device": "cpu"}
+        # changed to True for BAAI, to use cosine similarity
+        encode_kwargs = {"normalize_embeddings": True}
+
+        embed_model = HuggingFaceEmbeddings(
+            model_name=EMBED_HF_MODEL_NAME,
+            model_kwargs=model_kwargs,
+            encode_kwargs=encode_kwargs,
+        )
+
+    # using Chroma as Vector store
+    print(f"Indexing: using {VECTOR_STORE_NAME} as Vector Store...")
+
+    if VECTOR_STORE_NAME == "CHROME":
+        vectorstore = Chroma.from_documents(documents=splits, embedding=embed_model)
+    if VECTOR_STORE_NAME == "FAISS":
+        vectorstore = FAISS.from_documents(documents=splits, embedding=embed_model)
+
+    # increased num. of docs to 5 (default to 4)
+    retriever = vectorstore.as_retriever(search_kwargs={"k": MAX_DOCS_RETRIEVED})
+
+    # Build the class for OCI GenAI
+
+    # Only needed for OCI LLM
+    print(f"Using {LLM_TYPE} llm...")
+
+    if LLM_TYPE == "OCI":
+
+        llm = OCIGenAI(
+            service_endpoint="https://inference.generativeai.us-chicago-1.oci.oraclecloud.com",
+            compartment_id="ocid1.compartment.oc1..aaaaaaaajdyhd7dqnix2avhlckbhhkkcl3cujzyuz6jzyzonadca3i66pqjq",
+            model_kwargs={"max_tokens": 1000},
+            auth_type='SECURITY_TOKEN',
+        )
+    if LLM_TYPE == "COHERE":
+        llm = cohere.Client(COHERE_API_KEY)
+        response = llm.generate(
+            prompt="Please explain to me how LLMs work",
+        )
+        print(response)
+    return llm
+
+    # for now hard coded...
+    rag_prompt = hub.pull("rlm/rag-prompt")
+
+    print("Building rag_chain...")
+    rag_chain = (
+            {"context": retriever, "question": RunnablePassthrough()} | rag_prompt | llm
+    )
+
+    print("Init RAG complete...")
+    return rag_chain
+
+
+#
+# def: get_answer  from LLM
+#
+def get_answer(rag_chain, question):
+    response = rag_chain.invoke(question)
+
+    print(f"Question: {question}")
+    print("The response:")
+    print(response)
+    print()
+
+    return response